Nature biotechnology
研究揭示哺乳动物细胞中mRNA翻译效率的调控机制
小赛推荐:
本研究构建了一个涵盖140多种人和小鼠细胞类型的转录组范围翻译效率(TE)图谱,开发了深度学习模型RiboNN,显著提高翻译效率预测的准确性,揭示了mRNA序列特征对翻译调控的贡献,为mRNA治疗和基因疗法的设计优化提供了重要参考。
文献概述
本文《Predicting the translation efficiency of messenger RNA in mammalian cells》,发表于《Nature biotechnology》杂志,回顾并总结了哺乳动物细胞中mRNA翻译效率(TE)的序列编码特征,开发了基于深度学习的RiboNN模型,以高精度预测TE并揭示翻译调控的序列特征,包括5'UTR、CDS和3'UTR中的短序列对TE的影响,同时验证了其在疾病相关突变分析和mRNA治疗中的适用性。
背景知识
在真核生物中,mRNA翻译效率的调控机制尚未完全阐明,尽管已有多种机器学习模型尝试基于mRNA序列预测翻译效率,但多数仅关注5'UTR区域,而忽略了CDS和3'UTR对翻译的潜在影响。此外,已有研究表明,mRNA的稳定性、定位与翻译效率密切相关,但尚无统一模型能同时捕捉这些调控要素的序列特征。本研究通过整合大规模Ribo-seq和RNA-seq数据,构建了RiboNN模型,能够基于完整mRNA序列(包括5'UTR、CDS和3'UTR)准确预测TE,并揭示翻译调控的通用序列语言。该模型不仅提高了TE预测精度,还解释了多个疾病相关突变的翻译调控影响,为mRNA治疗和基因编辑研究提供了新的理论基础和工具。
研究方法与实验
研究团队系统整合了3819个Ribo-seq和RNA-seq数据集,构建了包含10,348个人类基因和10,870个鼠类基因的翻译效率矩阵。随后,他们开发了经典机器学习模型(如LGBM、lasso、elastic net)和深度学习模型(RiboNN)来预测TE。RiboNN采用多任务卷积神经网络架构,对整个mRNA序列进行端到端学习,特别强调起始密码子附近序列的调控作用,并通过插入突变分析和进化保守性分析进一步验证模型预测的生物学意义。
关键结论与观点
研究意义与展望
本研究为理解mRNA翻译调控提供了高精度的预测工具,并揭示了翻译、mRNA稳定性和亚细胞定位共享的序列调控语言。未来可进一步结合蛋白质组学、翻译后修饰数据优化模型,同时探索不同细胞类型间的翻译异质性,为mRNA治疗、基因编辑和疾病机制研究提供更精细的序列设计原则。
结语
本研究通过整合大规模Ribo-seq和RNA-seq数据,开发了RiboNN模型,能够基于完整mRNA序列预测翻译效率。该模型不仅揭示了mRNA翻译调控的序列特征,还能够解释疾病相关SNP的翻译影响,为基因功能研究、RNA治疗和药物开发提供了强有力的计算工具。该研究推动了对mRNA翻译机制的系统理解,并为下一代RNA疗法的序列优化提供了新的理论框架。