Nature Methods
Nicheformer提升单细胞与空间组学分析
小赛推荐:
该研究开发了Nicheformer,一种基于Transformer的单细胞与空间组学数据基础模型,能够有效捕获细胞的空间微环境信息。通过预训练和下游任务验证,Nicheformer在空间细胞类型、细胞密度和微环境组成预测中表现优异,为单细胞分析提供了新的空间信息整合工具。
文献概述
本文《Nicheformer: a foundation model for single-cell and spatial omics》,发表于《Nature Methods》杂志,回顾并总结了一种新的深度学习基础模型,用于单细胞和空间转录组数据的整合分析。该模型通过预训练在SpatialCorpus-110M数据集上,成功捕获了空间微环境信息,并在多个空间相关下游任务中展现出优越性能,特别是在空间细胞类型、微环境和区域预测方面。文章强调了传统单细胞分析方法在空间信息方面的不足,并提出Nicheformer作为下一代模型,能够将空间信息迁移到非空间单细胞RNA测序(scRNA-seq)数据中,提升其生物学解释力。
背景知识
近年来,单细胞基因组学和空间转录组技术的结合极大地推动了对组织微环境的理解。然而,传统单细胞测序方法依赖于细胞解离,导致微环境信息丢失,限制了对细胞间通讯和组织结构的深入研究。空间转录组技术(如MERFISH、CosMx、Xenium)能够保留细胞在组织中的空间位置,从而揭示细胞类型分布、微环境组成及空间基因表达梯度等关键信息。尽管已有基础模型(如Geneformer、scGPT)在单细胞数据中取得进展,它们未能有效整合空间信息。Nicheformer的提出填补了这一空白,其通过跨模态、跨物种和跨组织的预训练,实现了对解离细胞的空间信息预测,为单细胞数据的空间化分析提供了新工具。
研究方法与实验
研究团队构建了SpatialCorpus-110M数据集,包含超过5700万解离细胞和5300万空间解析细胞,涵盖73种组织和多种测序技术。Nicheformer采用Transformer架构,输入为基因表达的排序编码,并整合物种、测序技术和样本类型等上下文信息。模型训练采用自监督学习策略,在预测任务中利用细胞微环境的空间信息进行优化。
关键结论与观点
研究意义与展望
Nicheformer的提出为单细胞和空间组学分析提供了一种统一框架,使研究人员能够将空间信息迁移到传统解离scRNA-seq数据中,从而增强其生物学解释力。该模型有望推动跨物种、跨模态和跨疾病研究的标准化分析流程,并为下一代单细胞分析模型提供方法论参考。未来研究可进一步优化模型的可解释性,提升其在多组学整合和疾病特异性任务中的表现。
结语
Nicheformer是一项创新性的基础模型,通过大规模预训练和跨模态整合,成功将空间信息引入单细胞分析流程。该模型不仅在空间细胞类型、微环境和区域预测任务中表现优异,还展示了对不同测序技术和物种的广泛适应性。其在空间组学数据上的迁移学习能力,为非空间单细胞数据提供了空间注释,使研究人员能够更准确地解析组织微environment。该研究为单细胞分析模型的发展提供了新方向,特别是在空间解析和跨模态整合方面,具有广泛的应用前景。





