首页
模型资源
临床前CRO
赛业动态
客户支持
关于我们
商城
集团站群
CN
想了解更多的最新技术和发现?

Nucleic Acids Research
基于家族级生物物理可解释机器学习预测转录因子突变的DNA结合特异性

2025-08-31

小赛推荐:

该研究通过家族级生物物理可解释机器学习方法,成功预测转录因子(TF)突变体的DNA结合特异性变化。通过结合高通量体外结合数据和创新的四面体表示策略,研究为疾病相关突变对TF-DNA相互作用的影响提供了精准的计算框架,具有重要的转化医学和药物研发应用潜力。

 

文献概述
本文《Predicting the DNA binding specificity of transcription factor mutants using family-level biophysically interpretable machine learning》,发表于《Nucleic Acids Research》杂志,回顾并总结了利用高通量SELEX和PBM数据构建转录因子DNA结合模型的现有方法,进一步开发了一种参考基因家族水平的机器学习策略FamilyCode,以预测突变对TF-DNA结合自由能的影响。

背景知识
转录因子(TF)通过其DNA结合结构域与基因组DNA特异性结合,从而调控基因表达。这种结合特异性在发育、应激反应以及疾病发生中具有关键作用。TF结合位点的突变,尤其是DNA结合结构域中的错义突变,已被证明与多种发育障碍和遗传性疾病相关。尽管已有高通量体外结合数据(如SELEX-seq、PBM)和计算模型(如ProBound、FeatureREDUCE)来解析TF结合特异性,但如何准确预测突变对结合自由能的影响仍是一个挑战。本研究引入了一种创新的四面体坐标系统,将结合特异性参数映射到3D空间,从而在家族水平上实现对突变结合特异性变化的定量预测。研究以bHLH和HD家族TFs为测试对象,通过实验验证和交叉验证,展示了其在突变预测中的高准确性。这一方法为转录因子突变相关疾病的机制研究和药物设计提供了新的计算生物学工具。

 

提供高纯度、高滴度、多种血清型的AAV现货病毒,包含EGFP、mCherry、Luciferase荧光蛋白、Cre重组酶、GCaMP6f钙指示、化学遗传及光遗传等工具酶。提供AI辅助的AAV载体开发和优化改造服务。

 

研究方法与实验
研究团队整合了来自多个高通量DNA结合实验(HT-SELEX、PBM)的数据,构建了bHLH和HD家族转录因子的结合自由能模型。他们采用Manova分析、PCA回归和四面体坐标系统,将DNA结合自由能参数(ΔΔG/RT)映射到三维空间,从而识别蛋白序列中影响DNA结合特异性的关键位点。此外,研究通过突变体SELEX实验验证了突变对结合特异性的影响,并与现有方法(如rCLAMPS和DeepPBS)进行比较,评估FamilyCode的预测性能。

关键结论与观点

  • FamilyCode能够准确预测bHLH和HD家族转录因子突变对结合特异性的影响,预测性能显著优于基于序列同源性或已有PWM模型的方法。
  • 四面体表示法有效解决了传统ΔΔG/RT参数在非偏好碱基上的数值不稳定问题,使模型更适用于低亲和力结合位点的分析。
  • 通过PCA分析,研究识别出多个与结合特异性变化显著相关的氨基酸位点,其中13位精氨酸(Arg13)与−1位胞嘧idine(C)偏好直接相关,且这一关联在结构生物学中已有明确支持。
  • 突变体实验表明,HES2和ASCL2的R13V和R5K突变显著改变了其对E-box序列的结合特异性,且实验验证与预测高度一致。
  • 研究还发现,一些非DNA接触位点的氨基酸变异同样可影响结合特异性,提示远程结构效应在TF-DNA识别中的作用。

研究意义与展望
该研究为转录因子突变导致的结合特异性变化提供了可解释、可推广的计算模型,有助于深入解析疾病相关TF突变的功能影响。未来可拓展至其他转录因子家族,并结合体内数据进一步提升预测的生理相关性。此外,该方法可被用于大规模突变扫描和功能注释,为个性化医学和靶向治疗提供理论支持。

 

提供HUGO-Mab™全人单克隆抗体小鼠、HUGO-Light™全人共轻链抗体小鼠和HUGO-Nano™全人纳米抗体小鼠。提供基于HUGO-Ab®小鼠的抗体开发服务,包括动物免疫、细胞融合和筛选、亚克隆筛选和扩增、杂交瘤测序和功能验证。

 

结语
本文介绍了一种基于家族水平的可解释机器学习方法,用于预测转录因子突变对DNA结合特异性的影响。通过引入四面体坐标系统,研究团队成功将结合自由能参数转换为3D空间中的位置,使得突变效应的定量预测成为可能。研究还通过实验验证了突变体结合特异性变化,展示了模型的高准确性。这一方法不仅为发育障碍和癌症等疾病相关突变的功能解析提供了新工具,也为高通量突变扫描和药物靶点优化提供了计算基础。未来,结合更多体内结合数据和蛋白质结构信息,该方法有望进一步提升预测的精度与适用性。

 

文献来源:
Shaoxun Liu, Pilar Gomez-Alcala, Christ Leemans, Richard S Mann, and Harmen J Bussemaker. Predicting the DNA binding specificity of transcription factor mutants using family-level biophysically interpretable machine learning. Nucleic Acids Research.
想了解更多的最新技术和发现?
转录因子突变
DNA结合特异性
转录因子
生物物理可解释机器学习
转录因子家族
突变预测

上一篇:Cell Genomics 预测TCR-表位相互作用:我们做得如何?

下一篇:Nucleic Acids Research ARMAN-2 VSEN结构揭示RNA剪接酶底物识别机制

aav