国家生物信息中心相助开发基于深度学习模子的空间转录组细腻区分率细胞注释算法STASCAN
细胞在组织和器官内的空间位置与其功效细密相关。新兴的空间转录组手艺能够在组织中原位捕获转录信息,为研究职员剖析基因表达谱从而解码细胞空间漫衍、破译组织的空间结构、明确重大的生物学功效提供了条件。
目今主流的空间转录组手艺分为两种,基于成像的手艺和基于高通量测序的手艺。其中,基于高通量测序的手艺由于拥有成熟的商业产品应用更为普遍。然而,基于高通量测序的空间转录组手艺往往受限于粗粒度的区分率,其在简单捕获域中丈量多个细胞的混淆转录本,且捕获域间隙间保存大片未丈量的组织区域。同时,虽然一连丈量的空间转录组切片可用于构建三维细胞图谱以破译器官结构,但高昂的手艺本钱往往只允许对一小部分一连的组织切片举行测序,从而导致了Z轴偏向受限的区分率,阻碍了三维图谱的建设。
现有的盘算要领通过反卷积等方法实现了捕获域内混淆细胞类型注释,但未对捕获域间未丈量区域细胞类型举行填补,提升的区分率有限。别的,现有要领往往只关注基因表达信息,未团结形态学信息举行细胞注释,注释准确度也有待提高。
10月22日,国家生物信息中心杨运桂团队和兴发娱乐数学与系统科学研究院张世华团队相助在Genome Biology?揭晓了题为STASCAN deciphers fine-resolution cell-distribution maps in spatial transcriptomics by deep learning?的研究论文,针对差别空间转录组手艺、差别生物组织建设解码细胞空间细腻漫衍、剖析特异组织结构的新工具STASCAN。
STASCAN基于深度学习模子,整合空间转录组基因表达数据和组织学图像,实现组织切片未丈量区域细胞类型展望及丈量区域捕获域内细胞细分注释。STASCAN的焦点优势在于,它不但能以高精度举行细胞类型注释并显著增强细胞空间区分率,还可剖析原始区分率下无法识别的细腻组织结构,并进一步展现详尽的细胞类型小生境,加速研究职员对发育和疾病的明确。别的,STASCAN仅基于相邻切片的组织学图像天生细胞漫衍图,从而能够构建更详细的3D细胞图谱,镌汰实验本钱。
STASCAN首先在公共涡虫空间数据集中举行原始区分率下的基准测试,着实现优于其他算法的精准细胞注释,且能够仅从图像展望细胞类型。STASCAN进一步于涡虫数据集中应用三个功效?,展现了原始区分率下无法识别的细腻组织结构、精准定位细胞混淆物的组成及其在亚区分率下的差别位置、仅基于相近染色图像实现细胞漫衍展望,最终乐成构建超原始区分率六倍的细腻细胞三维漫衍图谱。
别的,STASCAN乐成应用于来自差别空间转录组学手艺的跨物种的多个数据集。STASCAN在人类肠道数据集中准确定位肠道组织差别细胞层的界线;在人类肺数据集中特异识别微米级细腻结构;在人类心肌数据集中准确展望测序缺失区域中的潜在细胞漫衍,重绘人体心肌梗死组织中的空间结构转变;在小鼠胚胎脑数据集中解码细胞空间细腻漫衍,精准复刻小鼠脑发育历程中组织剖解学结构。
综上所述,STASCAN提供了一种强盛的工具,用于整合空间基因表达信息和组织学图像举行细腻区分率细胞注释,在解码细胞空间细腻漫衍息争析特异组织结构方面展现出显著优势。随着空间转录组手艺的快速生长和数据的一直积累,STASCAN将对大规?占渥甲槭莸恼掀饰鎏峁┗∏坑辛Φ闹С。
国家生物信息中心博士研究生吴盈为本文第一作者,兴发娱乐数学与系统科学研究院张世华研究员和国家生物信息中心杨运桂研究员为本文配合通讯作者。本事情获得国家重点研发妄想、国家自然科学基金等项目资助。
STASCAN模子框架图
论文链接