首页
模型资源
临床前CRO
资源中心
科研工具
关于我们
商城
集团站群
CN

Nature methods
StringTie3通过解析新生与成熟转录本提升总RNA-seq组装

2026-06-13
加入邮件订阅!
您将获得赛业生物最新资讯
摘要速览
Nature methods | StringTie3通过解析新生与成熟转录本提升总RNA-seq组装

小赛推荐:

该研究为转录组分析提供了全新的计算框架,尤其在无需特殊实验设计的情况下解析转录与转录后调控,显著优化了总RNA-seq数据的利用效率。

 

文献概述

本文《StringTie3 Improves Total RNA-seq Assembly by Resolving Nascent and Mature Transcripts》,发表于《Nature methods》杂志,系统探讨了现有转录组组装方法在rRNA耗竭(总RNA-seq)数据中因无法区分新生转录本与成熟异构体而导致的组装错误问题。作者团队开发了StringTie3,通过引入‘新生模式’显式建模共转录剪接过程,显著提升了总RNA-seq的组装精度与生物学解析能力。该工具不仅适用于短读长、长读长,也支持混合组装,为全面解析转录组动态提供了统一解决方案。

背景知识

当前转录组分析广泛依赖poly(A)选择文库,虽富集成熟mRNA,却系统性丢失非多聚腺苷酸化RNA(如组蛋白转录本、部分lncRNA)及大量新生转录本,限制了对完整转录景观的捕捉。在癌症或快速增殖细胞中,新生RNA占比高,忽略其信号易导致假阳性组装和定量偏差。传统组装器常将高覆盖的内含子区域误判为外显子,造成转录本结构错误。此外,poly(A)选择在降解样本中偏好短转录本,引入长度偏差。尽管存在专门的新生RNA检测技术(如GRO-seq),但其对活细胞的依赖性限制了在临床样本中的应用。StringTie3的‘新生模式’通过识别共转录剪接产生的‘锯齿状’内含子覆盖模式,将新生RNA与成熟转录本分离,解决了转录本组装中长期存在的噪声与信号混淆问题。这一策略不仅提升了组装准确性,还实现了在单个总RNA-seq实验中同步量化转录与转录后调控,为研究基因表达调控提供了新维度。

 

针对乳腺癌等肿瘤研究,赛业生物提供涵盖乳腺癌、肝癌、肠癌等多种肿瘤细胞系,支持体内移植药效模型构建,适用于肿瘤免疫治疗、药物筛选与开发。提供已验证的肿瘤细胞系超200种,支持IND申报,助力从靶点发现到药效评价的全流程研究。

 

研究方法与核心实验

作者基于StringTie2框架开发了StringTie3,核心创新在于‘新生模式’(nascent mode),该模式在剪接图中引入内含子节点和终止边,允许转录本在未剪接的内含子中终止,从而将新生RNA作为独立转录本建模。同时,优化了长读长模块以区分真实的poly(A)位点与内含子内的poly(A)引物假信号。在方法验证中,作者使用了多个rRNA耗竭的短读长数据集(包括DLPFC、乳腺癌、神经分化)以及长读长数据(ONT cDNA/dRNA、PacBio cDNA)和混合组装数据。通过与StringTie2、Scallop2、IsoQuant、Bambu等工具对比,评估其在敏感性、精度及SIRV spike-in上的表现。

关键结论与观点

  • StringTie3在rRNA耗竭的短读长数据中显著优于StringTie2和Scallop2,平均精度提升超过20%(vs StringTie2)和40%(vs Scallop2),且保持高敏感性。[数据发现] + [对后续转录组组装的指导意义]
  • 在匹配的poly(A)+与rRNA(-)文库中,StringTie3的新生模式使两者组装结果更一致,表明其有效校正了文库制备偏差。[数据发现] + [对后续实验设计的指导意义]
  • 在长读长和混合组装中,StringTie3通过精准识别3'端,显著提升组装精度,尤其在ONT cDNA数据中精度提升达43%。[数据发现] + [对后续长读长分析的指导意义]
  • 在Argonaute双/三敲除HCT116细胞中,新生模式分析揭示单敲除主要影响新生RNA而成熟RNA稳定,而多敲除则同时破坏两者,揭示了AGO蛋白在转录与转录后层面的缓冲作用。[数据发现] + [对后续基因调控机制研究的指导意义]
  • 在乳腺癌样本中,胶原基因家族(如COL5A1COL3A1)在成熟RNA中上调幅度大于新生RNA,提示存在共享的转录后激活机制,可能与miR-29的失活有关。[数据发现] + [对后续癌症微环境研究的指导意义]

研究意义与展望

StringTie3的推出标志着总RNA-seq从单纯转录本发现向机制解析的转变。其‘新生模式’为研究转录动力学提供了计算工具,使研究人员能够在常规测序数据中探究转录与转录后调控的平衡,无需额外实验成本。对于药物开发,该工具可帮助识别受转录后机制调控的关键靶点(如HMGA2MYC),避免因仅看成熟RNA而误判靶点稳定性。在临床监测中,总RNA-seq结合StringTie3可更全面地捕捉疾病相关转录本异变,尤其适用于福尔马林固定样本等降解材料,克服poly(A)选择的局限。

 

为深入研究基因功能与疾病机制,赛业生物提供全基因组敲除细胞库服务,涵盖肿瘤、心血管、神经等20多种研究领域。现货细胞库快至1周发货,支持高通量基因筛选与药物靶点发现,适用于大规模功能基因组学研究与药物开发项目。

 

结语

StringTie3通过创新性地建模共转录剪接过程,解决了总RNA-seq数据中新生与成熟转录本混淆的核心难题。该工具不仅大幅提升转录本组装的准确性,更开创了在单组学实验中解耦转录与转录后调控的新范式。对于癌症、神经退行性疾病等复杂疾病,其能够揭示如COL5A1、MYC等关键基因在表达调控不同层级的异常,为理解疾病机制提供更精细的图谱。从实验室到临床,StringTie3使总RNA-seq成为更强大、更具成本效益的分析手段,尤其适用于珍贵或降解的临床样本。其对转录组分析流程的优化,将推动从基因列表到机制解析的转化,成为未来转录组研究的基石工具之一。

 

文献来源:
Ida Shinder, Geo Pertea, Richard Hu, Zoe Rudnick, and Mihaela Pertea. StringTie3 Improves Total RNA-seq Assembly by Resolving Nascent and Mature Transcripts. Nature methods.