首页
模型资源
临床前CRO
赛业动态
客户支持
关于我们
商城
集团站群
CN
想了解更多的最新技术和发现?

Nature Genetics
Pangenome基因分型工具ctyper揭示复制基因的全球多样性与表达差异

2025-11-14

小赛推荐:

本研究开发了ctyper工具,能够基于pangenome实现CNV和CMR基因的等位基因特异性分型,显著提高基因表达预测的准确性,并揭示基因重复在群体中的表达差异。

 

文献概述
本文《Pangenome基因分型工具ctyper揭示复制基因的全球多样性与表达差异》,发表于《Nature Genetics》杂志,回顾并总结了基因拷贝数变异(CNV)研究中的挑战,介绍了ctyper这一新方法如何克服这些问题,并在3,351个CNV基因和212个挑战性医学相关基因(CMR)中展示了其卓越的分型性能。ctyper在单核CPU上只需1.5小时即可完成全基因组分型,其分型结果在基因表达预测上相比已知表达数量性状基因座(eQTL)变异数据提升4.81倍。研究还揭示了paralog-specific表达差异,例如SMN2因SMN1转换导致表达降低,以及AMY2B的转位重复表达增加。研究最后表明,ctyper适用于生物样本库规模的CNV和CMR基因分型。

背景知识
拷贝数变异(CNV)是基因组结构变异的重要形式,与多种疾病表型、身体质量指数及癌症等疾病相关。尽管CNV在基因组中相对少见,但在长低拷贝重复区域(segmental duplications)中富集,这些区域的基因重复事件容易引发非等位基因同源重组(NAHR),导致表型多样性及疾病易感性。目前的CNV检测工具依赖覆盖度分析,难以准确检测多等位基因间的序列变异,且存在比对偏差。高精度的pangenome组装为解决这一问题提供了可能,但如何在基因重复区域准确区分等位基因与paralog仍具挑战。ctyper的开发填补了这一空白,通过k-mer分析实现高精度、快速分型,为大规模基因组研究提供了有力工具。

 

基因敲除小鼠:通过基因敲除技术,使小鼠全身组织和细胞中不表达目标基因,适用于研究基因的全身功能。条件性基因敲除小鼠利用Cre-LoxP系统实现特定组织或细胞中基因敲除,避免胚胎致死问题,适用于研究基因在特定组织或时期的生理功能。

 

研究方法与实验
ctyper方法基于pangenome构建基因单倍型片段(PAs),每个PA代表一个基因的等位基因序列,包含外显子、侧翼序列及单体型信息。研究通过比对NGS样本中的低拷贝k-mer(k=31)与PA矩阵,使用最小二乘方法匹配样本与PA的k-mer计数,推断PA特异性拷贝数(paCN)。研究还构建了包含3,351个CNV基因和212个CMR基因的PA数据库,使用114个PacBio HiFi组装基因组进行验证,涵盖1000基因组计划(1kGP)和GTEx等群体数据。

关键结论与观点

  • ctyper在3,351个CNV基因中捕获96.5%的phased变体,拷贝数正确率≥99.1%,在212个CMR基因中捕获94.8%的phased变体。
  • ctyper在单核CPU上仅需1.5小时完成全基因组分型,速度远超现有工具,且表达预测准确性提升4.81倍。
  • 研究揭示了7.94%的paralog在表达水平上存在显著差异,4.68%的paralog表现出组织特异性表达偏倚。
  • SMN2因SMN1转换导致表达降低,而AMY2B的转位重复则表现出表达增强,提示CNV在疾病机制中的重要性。
  • 通过PCA分析,研究发现非洲人群的CNV多样性更高,且F统计量分析显示部分基因(如HERC2P9、SMN基因)具有群体特异性。
  • ctyper在eQTL分析中显著优于传统eQTL方法,特别是在多等位基因情况下,其表达预测更准确。

研究意义与展望
ctyper为大规模基因组研究提供了高精度、高效率的CNV分型方法,适用于生物样本库分析,且能够揭示paralog-specific序列变异与表达差异。未来研究可进一步优化PA构建策略,提升在复杂结构变异区域的分型能力,并拓展至更多物种与疾病模型。

 

基因敲入小鼠:在目标基因位置引入特定突变或外源基因,如点突变、报告基因插入,用于模拟人类疾病或跟踪基因表达。条件性基因敲入小鼠通过重组酶系统实现条件性基因表达,适用于研究基因在特定条件下的功能。

 

结语
ctyper是一种基于pangenome的高效拷贝数变异(CNV)分型工具,能够准确识别等位基因特异性拷贝数并解析复杂基因重复的表达差异。其在3,351个CNV基因和212个医学相关基因中均表现出优异的分型准确性与速度,为大规模基因组研究提供了新方法。研究还揭示了SMN2因SMN1转换导致表达降低,以及AMY2B转位重复表达增强等重要生物学现象,提示CNV在疾病机制与演化适应中的潜在作用。ctyper的应用将有助于更深入地研究基因重复在人类多样性、疾病易感性和药物反应中的功能,为精准医学与功能基因组学研究提供有力支持。

 

文献来源:
Walfred Ma and Mark J P Chaisson. Genotyping sequence-resolved copy number variation using pangenomes reveals paralog-specific global diversity and expression divergence of duplicated genes. Nature Genetics.
想了解更多的最新技术和发现?
基因分型工具
ctyper
基因重复
基因表达
赛业生物

上一篇:Nucleic Acids Research Photocontrolled dissociation and toehold-mediated strand displacement-based synergistic regulation of CRISPR-Cas12a

下一篇:Nucleic Acids Research Coralysis实现单细胞数据中不平衡细胞类型和状态的高灵敏度整合