Nature Genetics
INSPIRE算法实现多平台空间转录组数据的可解释整合分析

2026-05-19

研究领域分类

免疫（445）肿瘤（572）代谢及心血管（447）神经及肌肉（578）眼科（37）其他（573）

加入邮件订阅!

您将获得赛业生物最新资讯

摘要速览

Nature Genetics | INSPIRE算法实现多平台空间转录组数据的可解释整合分析

小赛推荐：

该研究为空间转录组数据整合提供了可解释、可扩展的深度学习框架，显著提升了跨技术、跨样本数据联合分析的准确性与生物学可解释性，对肿瘤微环境异质性解析和发育轨迹重建具有直接指导意义。

文献概述

本文《Interpretable, flexible and spatially aware integration of multiple spatial transcriptomics datasets from diverse sources》，发表于《Nature Genetics》杂志，系统探讨了如何有效整合来自不同技术、样本和条件的空间转录组（ST）数据以揭示组织空间结构和生物过程。作者提出了一种名为INSPIRE的深度学习方法，结合对抗学习与非负矩阵分解（NMF），实现了对多源ST数据的可解释整合。该方法不仅解决了批次效应干扰问题，还能识别具有明确生物学意义的空间因子和基因程序，为复杂组织系统的精细解析提供了新工具。

背景知识

当前空间转录组技术（如Visium、Slide-seq、MERFISH、Xenium等）虽能保留基因表达的空间信息，但不同平台间存在显著技术差异，导致数据难以直接比较。在肿瘤研究中，肿瘤微环境的高度异质性使得传统聚类方法难以捕捉精细的细胞亚群空间分布。同时，在发育生物学中，跨时间点或空间切面的数据整合常受制于样本间变异，影响对动态过程的准确建模。现有方法如Seurat、Harmony缺乏空间感知能力，而SpiceMix、NSFH虽引入空间约束，却难以处理多组学数据间的复杂混杂因素。因此，亟需一种既能保留空间结构又能消除技术偏差的整合策略。INSPIRE通过引入图神经网络（GNN）和对抗学习机制，精准分离生物信号与技术噪声，解决了批次效应与空间异质性共存的挑战，为构建全景式组织图谱提供了新路径。

针对肿瘤微环境异质性研究，赛业生物提供全人源化小鼠模型（如HUGO-Ab®）和免疫系统人源化小鼠，可用于构建精准肿瘤模型，支持免疫治疗药效评价。结合INSPIRE识别的空间因子，可验证特定微环境亚群对免疫检查点抑制剂的响应，加速抗癌新药开发。

研究方法与核心实验

作者在多种真实与模拟数据集上验证了INSPIRE的性能，包括人类背外侧前额叶皮层（DLPFC）的Visium数据、小鼠脑多切片（sagittal/coronal）数据、不同技术（Slide-seqV2与MERFISH）的整合、以及高分辨率Xenium人乳腺癌和Stereo-seq小鼠器官发生数据。在DLPFC数据中，INSPIRE成功对齐了来自三个供体的12个切片，恢复了L1–L6皮层层状结构，并识别出与兴奋性神经元相关的空间因子，结果与手工注释高度一致。在小鼠脑多切片整合中，INSPIRE准确保留了共享的同源皮层结构，同时保留了小脑、嗅球等切片特有结构，优于SpiceMix和PRECAST等方法。在跨技术整合中，INSPIRE利用MERFISH的高分辨率单细胞信息指导Slide-seqV2的数据注释，成功识别出Sema6A–Plxna2信号轴在内层皮层区域的潜在作用，展示了跨平台信息互补的优势。

关键结论与观点

INSPIRE在模拟与真实数据中均优于现有方法，在ARI、NMI、ASW等指标上表现最佳，表明其能更准确地捕捉真实的生物空间结构。
通过整合NMF与对抗学习，INSPIRE识别出可解释的空间因子（如皮层层、小脑层、肿瘤微环境亚区），其基因载荷与已知标记基因高度相关，为下游功能分析提供直接依据。
在Xenium乳腺癌数据中，INSPIRE识别出三种myoepithelial细胞亚群（KRT15、KRT16、ACTA2），揭示了非侵袭性与侵袭性肿瘤间微环境差异，提示KRT16高表达可能代表更具侵袭性表型。
在Stereo-seq小鼠器官发生数据中，INSPIRE构建了跨越E9.5–E16.5的时空图谱，动态展示了心脏、肝脏、肺等器官的发育轨迹，为器官发生研究提供了高分辨率资源。
INSPIRE支持基因表达补全（imputation），成功从Stereo-seq数据中补全seqFISH未检测的基因（如Id1、Foxd1），并揭示了肠管背腹侧的基因表达差异，拓展了低通量技术的分析维度。

研究意义与展望

INSPIRE为多平台、多样本空间转录组数据的整合提供了统一框架，特别适用于癌症、神经退行性疾病和发育障碍等复杂疾病的系统解析。其输出的可解释因子可直接用于通路富集、细胞通讯分析和三维组织重建，推动从描述性分析向机制性建模的转变。在药物开发中，该方法可用于识别治疗响应相关的空间微环境特征，指导靶点选择与生物标志物开发。未来结合单细胞多组学数据，可进一步解码基因调控网络的空间动态，助力精准医学。

为深入研究INSPIRE识别的关键基因（如KRT16、ACTA2）在肿瘤进展中的功能，赛业生物提供基因敲除与人源化小鼠模型定制服务。通过构建组织特异性基因修饰模型，可模拟肿瘤微环境变化，探究基因在原位肿瘤发生与侵袭中的作用机制。

结语

INSPIRE代表了空间转录组数据分析的重要进展，通过融合深度学习与可解释建模，实现了对复杂组织系统的高精度、高可解释性解析。其在人类乳腺癌和小鼠器官发生中的成功应用，展示了在肿瘤异质性和发育动态研究中的强大潜力。该方法不仅提升了数据整合的准确性，更重要的是提供了直观的生物学因子，使研究人员能够直接关联空间结构与基因程序。对于实验室而言，INSPIRE降低了多平台数据整合的技术门槛，加速了从数据生成到机制发现的转化。在临床层面，其识别的微环境亚型可能成为新的预后标志物或治疗靶点，为个体化治疗策略提供空间维度的决策支持。随着空间组学技术的普及，INSPIRE有望成为构建“数字组织图谱”的标准工具，推动基础研究与临床转化的深度融合。

文献来源：

Jia Zhao, Xiangyu Zhang, Gefei Wang, Rui B Chang, and Hongyu Zhao. Interpretable, flexible and spatially aware integration of multiple spatial transcriptomics datasets from diverse sources. Nature Genetics.

更多热门文章推荐

Nature metabolism
果糖：代谢信号与现代健康风险

Annual review of biochemistry
婴儿肠道菌群的塑造：母乳寡糖的多维度调控机制