
Nature Methods
MrVI模型助力单细胞基因组学样本异质性分析
小赛推荐:
本文介绍了一种名为MrVI的深度生成模型,该模型能够基于单细胞RNA测序数据在无须预先定义细胞状态的情况下,实现样本的分层与比较分析。通过MrVI,研究人员能够识别与疾病状态相关的细胞亚群,并评估小分子药物对基因表达和细胞组成的影响,从而在大规模队列研究中实现高分辨率分析。
文献概述
本文《Deep generative modeling of sample-level heterogeneity in single-cell genomics》发表于《Nature Methods》杂志,回顾并总结了单细胞基因组学在队列研究中的应用,特别是在无需预先定义细胞状态的情况下,实现样本层面的异质性分析。研究团队开发了一种多分辨率变分推理模型(MrVI),通过模拟样本间距离矩阵,能够有效揭示不同细胞亚群在疾病中的变化,如在炎症性肠病和新冠研究中的特定细胞类型。文章展示了MrVI在疾病分层、药物扰动分析和转录组异质性解析中的强大能力,为单细胞水平的队列研究提供了新的分析框架。
背景知识
单细胞基因组学近年来在多样本研究中取得了显著进展,使得研究人员能够深入分析细胞与分子层面的异质性。然而,传统分析方法通常依赖于细胞状态的预先聚类,限制了其在复杂疾病和药物响应中的应用。MrVI模型通过无监督学习细胞表示,并结合反事实分析,实现了在不同样本间进行高分辨率的差异表达(DE)和差异丰度(DA)分析。该方法特别适用于探索疾病分层、药物作用机制以及细胞微环境变化等研究。MrVI的开发解决了现有方法在处理样本异质性时无法控制混杂因素的问题,并为整合大规模单细胞数据提供了新的解决方案。
研究方法与实验
MrVI模型基于贝叶斯分层架构,结合了变分推理与神经网络,通过两个潜在变量un和zn来区分细胞状态与样本特异性变化。un用于捕获细胞状态的共享信息,而zn则结合样本ID与协变量,反映靶向协变量对细胞状态的影响。模型通过负二项分布生成基因表达数据,并利用反事实嵌入计算样本距离矩阵,从而进行分层聚类和差异分析。实验部分通过半合成数据集、新冠患者PBMC数据、sci-Plex药物扰动数据以及克罗恩病肠组织数据验证MrVI的性能,并与现有方法(如scVI、Milo)进行比较。
关键结论与观点
研究意义与展望
MrVI提供了一种新的深度生成模型框架,适用于大规模单细胞队列研究,特别是在无预先定义细胞状态的情况下进行高分辨率样本异质性分析。未来可拓展至多组学整合分析,进一步提升其在疾病机制研究与药物开发中的应用潜力。
结语
MrVI模型通过结合深度学习与反事实分析,成功实现了在单细胞水平上对样本异质性的高分辨率解析。该模型不仅在探索性分析中能够自动识别样本分层,还在比较分析中准确检测基因表达与细胞丰度的细微变化。其在新冠、IBD及药物扰动研究中的应用展示了其在临床与转化研究中的广泛适用性。对于单细胞研究者而言,MrVI提供了一种新的分析工具,能够有效提升多样本队列研究的深度与准确性,同时为药物开发与疾病机制研究提供新的视角。






