Nature Genetics
疾病风险预测新突破:EHR与PGS互补性研究
小赛推荐:
本研究系统评估了基于电子健康记录(EHR)的表型风险评分(PheRS)在跨生物样本库中的泛化能力,并与多基因风险评分(PGS)进行比较,揭示两者在疾病风险预测中的互补作用,为精准医疗提供新思路。
文献概述
本文《Cross-biobank generalizability and accuracy of electronic health record-based predictors compared to polygenic scores》,发表于《Nature Genetics》杂志,回顾并总结了电子健康记录(EHR)与多基因风险评分(PGS)在13种常见疾病预测中的应用及其跨研究泛化能力。文章基于三个大型生物样本库(FinnGen、UKB和EstB)的数据,系统评估了PheRS模型在不同人群中的稳定性及其与PGS模型的互补性,研究结果为整合临床和遗传信息用于疾病风险预测提供了理论支持。
背景知识
近年来,精准医疗的发展推动了EHR和基因组数据在疾病风险预测中的广泛应用。PGS通过整合全基因组变异信息预测个体的遗传易感性,已在心血管疾病、糖尿病等研究中取得一定成果;而PheRS则利用EHR中的诊断编码信息,构建表型风险评分。尽管PGS具有较高的遗传稳定性,但其在不同族群中的泛化能力有限,可能加剧健康不平等。而PheRS作为新兴的表型预测工具,其是否能在不同医疗系统中保持一致性,以及与PGS的协同作用,尚缺乏系统性验证。本研究填补了这一空白,为未来整合多组学与临床数据提供参考。
研究方法与实验
研究纳入了845,929名年龄在32–70岁之间的个体,来自三个大型生物样本库(FinnGen、UKB和EstB),使用弹性网络(elastic net)回归模型构建PheRS以预测13种常见疾病的发病风险。模型训练基于1999年至2009年间的phecode(疾病编码)数据,并在2011年至2018年间进行验证。PheRS与PGS的关联性通过Cox比例风险模型进行评估,并在不同模型中加入年龄、性别、教育水平和 Charlson合并症指数进行校正,以评估其独立预测能力。
关键结论与观点
研究意义与展望
本研究首次系统评估了EHR表型评分在不同人群中的泛化能力及其与PGS的互补性,为整合临床与遗传信息进行疾病风险预测提供了实证支持。未来可进一步探索EHR评分在非欧洲人群中的表现,以及结合其他组学数据(如蛋白质组、代谢组)以提升预测精度。
结语
本研究系统比较了基于电子健康记录的表型风险评分(PheRS)与多基因风险评分(PGS)在13种常见疾病中的预测表现,发现两者在疾病风险预测中具有良好的独立性和互补性。PheRS在不同生物样本库中表现出高度泛化能力,尤其在痛风、T2D、肺癌等疾病中表现突出。研究结果强调,EHR数据可作为遗传数据的有力补充,为精准医疗中的风险评估和早期干预提供新的工具。