
Nature Methods
一种基于进化信息的3D RNA模体与二级结构联合预测新方法
小赛推荐:
该研究开发了一种新型RNA折叠算法CaCoFold-R3D,能够同时预测RNA二级结构与3D模体,且不依赖特定模体的已知结构信息。该方法在大型RNA结构如核糖体RNA上表现出色,并能高效识别多种已知3D模体,为RNA结构预测和药物设计提供了新的计算工具。
文献概述
本文《All-at-once RNA folding with 3D motif prediction framed by evolutionary information》,发表于《Nature Methods》杂志,回顾并总结了RNA结构预测领域中3D模体与二级结构的联合建模方法。文章提出了一种新的RNA结构预测工具CaCoFold-R3D,该工具基于进化信息,使用概率上下文无关文法(SCFG)和隐马尔可等模型(HMM)对RNA结构进行联合预测,能够识别超过96种不同的3D模体。整段通顺、有逻辑,结尾用中文句号。
背景知识
RNA的3D结构在非编码RNA功能中具有关键作用,其中3D模体(或模块)在结构RNA的折叠和功能实现中起着重要角色。当前RNA结构预测方法主要关注二级结构,而缺乏对3D模体的整合预测能力,且多数方法只能逐个预测特定模体。CaCoFold-R3D的提出填补了这一空白,它结合进化信息,利用R-scape分析共变位点,并通过分层策略预测所有已知3D模体,同时确保预测的二级结构和3D模物在结构上的一致性。这种方法的创新性在于其“all-at-once”联合预测能力,能够一次性预测多个模体并整合到整体结构中,而非逐个识别。该研究为RNA结构预测、药物靶点设计和模体发现提供了新的计算框架,具有广泛的应用前景。
研究方法与实验
CaCoFold-R3D基于一种新的分层策略,将共变信息分为多个层次。第一层包含最大数量的共变碱基对,用于预测主要RNA二级结构,其余层用于识别假结和其他三级碱基对相互作用。该方法使用R3D语法模型,结合SCFG和HMM,描述不同类型的3D模体(如发夹、内环、J3、J4等)。每个模体模型通过最大熵原则分配概率,以避免过拟合。CaCoFold-R3D还可通过Rfam数据库验证模体预测的准确性,并使用R3D-prototype进行初步测试,评估预测灵敏度和假阳性率。
关键结论与观点
研究意义与展望
CaCoFold-R3D为RNA结构预测提供了一种全新的联合建模方法,能够同时识别3D模体和二级结构,且具有较高的预测准确率和计算效率。该方法在结构RNA研究、RNA药物设计、以及3D模体数据库构建中具有广泛应用前景。未来工作可进一步扩展模体库,并结合深度学习框架,提高全原子结构预测能力。
结语
本研究提出的CaCoFold-R3D方法成功实现了RNA二级结构与3D模体的联合预测,利用进化信息和共变分析显著提升了模体识别的准确性。该方法不仅适用于多种RNA家族,还可在大型RNA分子(如核糖体RNA)中保持高效性,为RNA结构生物学和药物设计提供了重要的计算工具。CaCoFold-R3D的开发标志着RNA折叠预测从二级结构向三级结构的迈进,未来有望在结构基因组学、RNA治疗和疫苗开发中发挥更大作用。






