Nature Methods
Nicheformer模型助力单细胞与空间组学分析
小赛推荐:
该研究提出了一种基于Transformer架构的Nicheformer基础模型,通过整合单细胞和空间转录组数据,实现了对细胞空间微环境的精准预测,解决了传统单细胞测序无法获取空间信息的局限性。
文献概述
本文《Nicheformer: a foundation model for single-cell and spatial omics》,发表于《Nature Methods》杂志,回顾并总结了单细胞与空间转录组学数据整合分析的最新进展。研究团队开发了一种新的基础模型——Nicheformer,通过大规模训练,成功捕捉细胞空间微环境特征,从而实现了从空间组学数据向非空间单细胞RNA测序数据的有效信息转移。背景知识
单细胞RNA测序(scRNA-seq)技术虽然在细胞异质性研究中广泛应用,但其依赖于细胞解离,丢失了细胞在组织中的原始空间信息。近年来,图像引导的空间转录组学技术如MERFISH、CosMx、Xenium等提供了细胞空间位置信息,但其基因检测通量有限。本研究通过整合超过1.1亿个细胞的多模态数据,构建了SpatialCorpus-110M数据库,为模型训练提供了坚实基础。Nicheformer在空间标签预测、细胞微环境推断等任务中显著优于传统方法,特别是在跨模态数据迁移方面展现出强大潜力。
研究方法与实验
Nicheformer采用Transformer架构,输入长度为1500个基因token,通过训练模型识别空间组学与单细胞测序数据中的细胞类型、区域和微环境特征。研究团队使用SpatialCorpus-110M进行预训练,其中包含5700万解离细胞和5300万空间解析细胞,覆盖73种组织,1000多个供体。模型训练过程中引入物种、模态和测序技术的上下文token,以提升跨模态识别能力。此外,研究还引入了空间邻域分析,定义不同半径下的细胞密度和类型组成,并通过线性探针和微调策略进行模型评估。关键结论与观点
研究意义与展望
该模型为单细胞与空间组学数据的整合分析提供了统一框架,有望推动跨组织、跨物种、跨技术的细胞功能研究与微环境分析。未来可扩展至多组学整合,如蛋白质组、代谢组与空间信息的联合建模,进一步提升细胞功能与状态的识别能力。
结语
本研究构建了Nicheformer这一新型基础模型,通过大规模单细胞与空间转录组数据的联合训练,成功实现了细胞空间信息的迁移预测。该模型在空间细胞类型识别、微环境推断、区域定位等任务中表现优异,尤其在低数据量训练下仍保持稳定性能。Nicheformer的提出为单细胞测序数据的高维空间解析提供了新工具,有助于提升非空间数据的生物学意义,推动组织微环境与细胞通讯研究的进一步发展。




