
Nature Microbiology
未分类基因组序列揭示全球微生物组中大量隐藏的细菌与古菌多样性
小赛推荐:
该研究强调了当前宏基因组分析流程中大量微生物多样性被遗漏的问题,提示在微生物组研究中需优化基因组分箱策略以更全面捕捉物种和更高阶分类单元,为复杂环境样本的实验设计提供了关键参考。
文献概述
本文《Unbinned contigs expand known diversity in the global microbiome》,发表于《Nature Microbiology》杂志,系统探讨了基于92,187个公开宏基因组样本的未分类序列(unbinned contigs)中隐藏的原核生物多样性。通过系统发育标记基因聚类分析,研究揭示了当前基因组中心方法在捕获微生物多样性方面的显著局限性,尤其是在土壤和水生环境中存在大量未被描述的谱系。研究进一步表明,原核生物的谱系规模分布遵循幂律规律,支持了Willis和Yule提出的古老生态进化模型。背景知识
1. 该研究解决的微生物组多样性痛点。尽管微生物在地球生态系统中无处不在,且对生物地球化学循环至关重要,但目前对原核生物(Bacteria和Archaea)真实多样性仍缺乏全面认知。传统基于16S rRNA扩增子的研究受限于分辨率,而基于宏基因组组装基因组(MAGs)的方法虽提升了分类精度,却仍遗漏了大量序列,尤其是低丰度或难组装的基因组。这些未被利用的“未分类序列”构成了一个巨大的可发现多样性储库,亟需系统评估。
2. 目前MAGs的研究瓶颈。当前自动化分箱工具在精确度和召回率上均存在局限,导致大多数组装出的序列未被分配至高质量基因组。这不仅限制了对新物种乃至新门的发现,也阻碍了对微生物进化模式的深入理解。此外,不同环境中的采样偏差进一步加剧了多样性估计的不准确性。
3. 选题切入点。作者利用SPIRE资源中大规模、跨栖息地的宏基因组数据,结合130个系统发育标记基因,系统量化了可发现的物种及更高阶谱系。通过区分已分箱MAGs与未分箱序列,并应用稀有化曲线与系统发育划分方法,研究直接评估了“未分类序列”在扩展已知多样性中的作用,同时检验了原核生物多样性是否遵循Yule-Simon过程等进化模型。GC含量、物种丰富度和系统发育树等参数被用于深入解析多样性分布模式。
研究方法与核心实验
作者整合了92,187个公开宏基因组样本,使用130个保守的系统发育标记基因(120个细菌,53个古菌)进行序列提取与聚类。通过MMseqs2进行96.5%相似度聚类,定义物种级簇,并利用稀有化曲线估计总可发现多样性。谱系划分基于相对进化分歧(RED)阈值,用于识别门至属级别的谱系。Yule-Simon分布和幂律模型被拟合到谱系规模分布中,以评估进化模式。不同栖息地的采样强度和发现系数(α)被计算以评估多样性发现趋势。关键结论与观点
研究意义与展望
该研究揭示了当前宏基因组分析流程的重大盲点,强调未分类序列是发现新微生物谱系的关键资源。这为宏基因组数据再分析提供了新方向,未来应开发更灵敏的分箱和基因组恢复工具,以充分利用现有数据。
从药物开发角度看,大量未培养微生物可能编码新型天然产物,因此挖掘这些隐藏基因组可能发现新的抗生素或生物催化剂。此外,理解多样性生成的进化规律有助于预测微生物适应潜力,对气候变化响应模型具有重要意义。
结语
本研究系统揭示了全球微生物组中大量隐藏的原核生物多样性,表明当前基因组中心方法仅捕获了冰山一角。未分类序列中蕴含着数十万未描述物种和数十个新门,尤其是在土壤和水生环境中。这一发现不仅重构了我们对微生物多样性的认知,也为未来环境采样和基因组恢复策略提供了明确方向。从实验室到临床转化,这些新谱系可能编码具有生物医学价值的代谢通路,例如抗生素抗性基因或新型免疫调节分子。此外,揭示原核生物多样性遵循Yule-Simon过程,支持了“富者愈富”的进化模型,为预测微生物适应与演化提供了理论框架。该研究为微生物组研究、环境监测和药物发现奠定了重要基石,强调需将未分类序列纳入常规分析流程,以全面理解微生物世界的复杂性与功能潜力。





