Nature Methods
eSIG-Net：基于语言模型的单突变蛋白互作网络重编程预测工具

2026-06-15

研究领域分类

免疫（420）肿瘤（537）代谢及心血管（409）神经及肌肉（540）眼科（36）其他（535）

加入邮件订阅!

您将获得赛业生物最新资讯

摘要速览

Nature Methods | eSIG-Net：基于语言模型的单突变蛋白互作网络重编程预测工具

小赛推荐：

该研究为解析肿瘤等疾病中单氨基酸突变对蛋白互作网络的影响提供了全新的计算框架，显著提升了对变异功能的精准预测能力，有助于指导基因编辑细胞系实验设计和疾病建模策略。

文献概述

本文《eSIG-Net: an interaction language model that decodes the protein code of single mutations》，发表于《Nature Methods》杂志，系统探讨了如何利用深度学习模型从蛋白质序列信息中精准预测单个氨基酸突变对蛋白–蛋白相互作用（PPI）网络的影响。作者提出了一种创新的“edgetic”突变语言模型——eSIG-Net，通过整合语法感知与进化感知的突变编码机制，实现了对突变驱动的互作扰动的高精度识别。该方法在多个独立数据集上显著优于现有基于序列和结构的预测工具，展现出强大的泛化能力。

背景知识

当前，尽管高通量测序已识别出数百万个编码变异，但绝大多数仍被归类为意义未明变异（VUS），严重阻碍了肿瘤、神经退行性疾病等遗传病的精准诊疗进程。其中，错义突变虽仅改变一个氨基酸，却可能引发“互作断崖”（interaction cliff）效应，导致关键信号通路重编程。现有方法如AlphaMissense虽能预测致病性，但难以解析其对特定PPI网络的扰动机制。而传统结构预测工具如FoldDock在面对某些疾病突变时表现不佳，无法准确捕捉构象动态变化。因此，亟需一种不依赖三维结构、仅从序列出发即可解码突变“蛋白密码”的计算模型。eSIG-Net正是在此背景下提出，旨在通过整合蛋白语言模型与对比学习策略，实现对TPM3、COQ8A等基因突变所致互作网络重编程的精准建模，为破解VUS功能提供新路径。

针对阿尔茨海默病、脊髓性肌萎缩、视网膜色素变性等罕见病，可提供HUGO-GT®全基因组人源化模型，搭载了更高效的大片段载体融合技术，可以作为万能模板进行针对性的突变定制服务，是更贴近真实世界生物机制的药物临床前研究模型，我们期待与你共同开发新型全基因组人源化小鼠，加速基因治疗研究

研究方法与核心实验

eSIG-Net采用了双编码器架构，结合了蛋白语言模型（如ESM-2）的残基级嵌入与突变位点特异性学习模块。模型输入包括野生型、突变体及其互作伙伴的序列，通过通道式学习提取突变位点差异，并结合WT–互作伙伴与突变体–互作伙伴的联合编码，最终由判别器预测PPI扰动。作者在两个独立数据集——疾病突变PPI数据集和群体变异PPI数据集上进行了五折交叉验证，结果显示eSIG-Net在准确率、AUC和平均精度上均显著优于SDNN、D-SCRIPT、AlphaFold衍生工具等现有方法。此外，通过消融实验证实，突变位点编码与约束差异学习模块对性能提升至关重要。

关键结论与观点

在疾病突变PPI数据集中，eSIG-Net达到0.85±0.02的准确率，AUC为0.91±0.02，显著优于第二名的SDNN（AUC 0.73），表明其在识别致病性互作扰动方面具有卓越性能，对后续功能验证实验的设计具有重要指导意义
结构预测工具如FoldDock在部分案例中无法正确预测突变对PPI的影响，而eSIG-Net不依赖结构信息即可实现高精度预测，提示其在缺乏可靠结构模板时更具实用性，适用于COQ8A等膜蛋白研究
eSIG-Net成功解析了TPM3基因中L100M与M9R突变导致不同肌病表型的机制：前者选择性破坏与HSF2的互作，后者则保留该互作，揭示了等位基因特异性互作重编程的分子基础，为疾病建模提供机制性解释
模型通过对比学习有效区分细微序列差异，解决了“互作断崖”挑战，为未来开发基于PPI网络的药物靶标发现提供了计算工具

研究意义与展望

eSIG-Net的推出标志着从“突变致病性”预测迈向“突变机制性”解析的新阶段。其不依赖蛋白结构的特点使其可广泛应用于肿瘤驱动基因、神经发育障碍相关基因的大规模VUS功能注释，加速临床分级。同时，该模型可作为虚拟筛选工具，指导基因敲入细胞系构建，优先验证高扰动得分的变异，提升实验效率。

在药物开发层面，eSIG-Net有助于识别那些特异性破坏致病PPI而不影响野生型功能的“edgetic”药物靶点，推动精准干预策略。未来若整合组织特异性表达数据，还可进一步提升对自身免疫疾病中突变效应的预测精度。

提供高纯度、高滴度、多种血清型的AAV现货病毒，包含EGFP、mCherry、Luciferase荧光蛋白、Cre重组酶、GCaMP6f钙指示、化学遗传及光遗传等工具酶，支持神经科学研究、光遗传学研究和组织特异性基因表达调控，适用于eSIG-Net预测结果的体内功能验证实验

结语

eSIG-Net作为一种创新的突变中心化交互语言模型，成功实现了仅从蛋白质序列信息出发对单氨基酸突变引起的互作网络重编程进行高精度预测。该工具不仅在性能上显著超越现有方法，更重要的是提供了机制性洞察，例如解析TPM3不同突变导致异质性肌病的分子基础。对于实验室研究者而言，eSIG-Net可作为VUS功能预测的首选工具，指导基因编辑实验设计；在临床转化层面，它有望成为连接基因组变异与疾病机制的桥梁，提升对肿瘤、遗传性神经病等复杂疾病的分子分型能力。随着更多实验数据的积累，该模型还可进一步优化，推动个性化医疗中对突变功能的系统性解码，最终重塑疾病建模与靶向治疗开发的流程。

文献来源：

Xingxin Pan, Aditya Shrawat, Sidharth Raghavan, Nidhi Sahni, and S Stephen Yi. eSIG-Net: an interaction language model that decodes the protein code of single mutations. Nature Methods.

更多热门文章推荐

Diabetes Care
透析启动后司美格鲁肽的安全性：一项个体水平的荟萃分析

Molecular Cancer
乳腺癌免疫逃逸机制与新兴免疫治疗策略