Nature Microbiology
利用结构建模预测Asgard古菌中的真核细胞复杂性
小赛推荐:
该研究通过先进的蛋白质结构建模技术,在Asgard古菌中发现了大量结构上与真核蛋白相似的新型同源蛋白,揭示了真核细胞起源过程中古菌祖先可能具备更复杂的细胞功能。
文献概述
本文《利用结构建模预测Asgard古菌中的真核细胞复杂性》,发表于《Nature Microbiology》杂志,回顾并总结了Asgard古菌在真核细胞起源中的关键作用。研究团队通过扩展基因组数据集并结合从头蛋白质结构预测与结构比对技术,系统性地识别了908个结构上与真核蛋白高度相似的新型同源蛋白(iESPs),显著扩展了此前已知的真核特征蛋白(ESPs)谱系。这些蛋白涉及信息存储与处理、细胞信号传导以及膜区室化等关键功能,提示真核细胞的古菌祖先可能已具备远超预期的细胞复杂性。研究还首次在Asgard古菌中发现Vault和Commander蛋白复合物的同源物,为真核细胞内膜系统和囊泡运输的演化起源提供了新线索。整段通顺、有逻辑,结尾用中文句号,段落结尾使用背景知识
真核细胞的起源是生命演化史上最重要的事件之一,其标志是复杂的内膜系统、动态细胞骨架和核膜等结构的出现。目前广泛接受的内共生理论认为,真核细胞起源于一个古菌宿主细胞与一个α-变形菌内共生体的融合。近年来发现的Asgard古菌被认为是该古菌宿主的最近缘现生代表,其基因组编码大量此前被认为真核生物特有的蛋白(ESPs),如肌动蛋白、小GTP酶和ESCRT复合物亚基等。然而,由于序列同源性极低,许多真核蛋白的古菌同源物难以通过传统序列比对方法识别,导致对Asgard古菌细胞复杂性的重建受限。蛋白质结构比序列更保守,因此利用结构预测技术(如AlphaFold2、ESMFold)可突破“序列相似性黄昏区”(twilight zone),识别远距离同源蛋白。本研究正是基于此原理,构建了Asgard古菌泛基因组的结构图谱,系统挖掘其潜在的真核样蛋白,从而更全面地重构真核细胞祖先的生理与细胞生物学特征。段落结尾使用
研究方法与实验
研究团队整合了936个Asgard古菌基因组(包括新近测序的MAGs),构建了包含268万蛋白的泛基因组数据集。通过MMseqs2进行蛋白质聚类,获得37,313个包含至少5个成员的蛋白簇。对每个簇选取一个进化代表性序列进行从头结构预测。采用ESMFold快速预测结构,若pLDDT低于80则使用ColabFold(结合Asgard蛋白数据库)进行多序列比对增强预测,最终获得37,223个高质量结构模型。
基于结构相似性搜索(FoldSeek比对AF2-SwissProt数据库),研究人员定义了“同构型真核特征蛋白”(iESP):即其结构匹配在真核蛋白中显著富集的Asgard蛋白。通过Fisher精确检验评估真核序列富集性,并结合HMMer、HHsearch等工具进行功能注释。对候选iESP进行结构聚类,并选取代表性蛋白进行系统发育分析与多聚体结构建模,验证其与真核同源蛋白的演化关系。关键结论与观点
研究意义与展望
本研究突破了传统序列比对的局限,利用蛋白质结构信息揭示了Asgard古菌中远比此前认知更丰富的真核样蛋白组,极大丰富了我们对真核细胞最后真核共同祖先(LECA)前状态的理解。这些发现表明,真核细胞的复杂性并非完全由内共生事件后的新基因创新驱动,而是部分继承自一个已具备复杂调控和膜组织能力的古菌祖先。
未来研究应结合单细胞成像、原位结构生物学和功能验证实验,直接观察Asgard古菌中这些蛋白的亚细胞定位与功能。此外,对更多未培养Asgard谱系的基因组挖掘,将有助于重建更完整的演化路径。本研究为探索真核起源提供了新的结构演化框架,也为合成生物学中构建真核样原核细胞提供了潜在分子工具集。
结语
本研究通过大规模蛋白质结构建模与比对分析,系统揭示了Asgard古菌中存在大量结构上与真核蛋白相似的同源蛋白,显著扩展了真核特征蛋白的谱系。这些新发现的iESPs不仅涉及细胞骨架与囊泡运输等经典功能,更富集于信息处理与代谢调控,提示真核细胞的古菌祖先已具备高度复杂的细胞系统。特别是Vault和Commander复合物同源物的发现,为真核内膜系统的演化起源提供了关键证据。研究强调了蛋白质结构信息在解析深部分子同源性中的重要性,突破了序列比对的“黄昏区”限制。总体而言,该工作重塑了我们对真核细胞起源前夜的想象,表明真核复杂性在古菌宿主中已有深厚根基,而非完全由内共生事件后演化而来。这为未来探索真核起源的分子机制与细胞演化路径奠定了坚实基础。




