首页
模型资源
临床前CRO
资源中心
科研工具
关于我们
商城
集团站群
CN

Alzheimer’s & Dementia
Real-world prediction of early-onset dementia using health record data

2025-11-28
加入邮件订阅!
您将获得赛业生物最新资讯

小赛推荐:

本文开发了基于健康记录数据的早发性痴呆(EOD)风险预测与预后评估模型,采用多中心机器学习方法,在真实世界数据中展现出良好的判能力与适用性,适用于社区及初级医疗环境。

 

文献概述
本文《Real-world prediction of early-onset dementia using health record data: A multi-center machine learning study》,发表于Alzheimer’s & Dementia杂志,回顾并总结了早发性痴呆(EOD)风险预测模型的开发过程及验证结果。研究整合来自五个国际队列的数据,利用机器学习方法构建高精度模型,且通过SHAP分析解释关键特征贡献。该研究为EOD的早期筛查与预后评估提供了实用工具,具有良好的跨亚组公平性。

背景知识
早发性痴呆(EOD)是一种在65岁前发病的痴呆亚型,具有较高的临床异质性与非典型表现,导致其在临床实践中常被误诊或延迟诊断。相较于晚发性痴呆(LOD),EOD患者通常表现出更严重的认知障碍和更差的功能预后。尽管已有研究关注EOD的遗传和神经影像学生物标志物,但其筛查和预后评估仍缺乏简便、低成本的工具。本研究旨在填补这一空白,通过大规模队列数据和机器学习算法开发易于应用的EOD筛查与预后预测模型。该研究特别关注真实世界数据的可扩展性和模型的跨人群适用性,为初级医疗及社区筛查提供实用工具。

 

提供一站式基因编辑服务,涵盖基因敲除、敲入、点突变等,助力疾病模型构建与药物筛选。

 

研究方法与实验
研究纳入超过40万例无痴呆的基线个体,年龄均小于65岁。数据来自五个大规模队列(UKB、CHARLS、HRS、KLoSA、SHARE),其中四个队列用于训练和内部验证,而SHARE队列用于外部验证。采用集成学习方法(如CatBoost和Random Forest)构建EOD风险预测模型和预后模型。模型性能通过AUROC、AUPRC等指标评估,SHAP分析用于解释特征重要性。子组分析评估模型在不同人群中的公平性与稳定性。

关键结论与观点

  • 基于CatBoost的风险预测模型在内部验证中达到0.814 AUROC(<70岁)和0.892 AUROC(<65岁),显示良好判别能力。
  • 随机森林(RF)预后模型在5年预测中达到0.656 AUROC,表明其在预后评估中具有中等判别能力。
  • 关键预测因子包括年龄、就业状况和教育水平,且这些因子在不同子组中表现稳定。
  • 模型在不同性别、年龄及合并症亚组中表现一致,支持其跨人群公平性。
  • 研究提供了一种无创、可扩展的EOD筛查工具,适用于大规模社区和初级医疗环境。

研究意义与展望
本研究为EOD筛查和预后预测提供了首个多中心、真实世界验证的机器学习工具,填补了该领域空白。研究结果支持其在初级医疗和社区人群中的广泛适用性。未来研究需在更广泛人群中验证模型,并探索其在临床环境中的实用性。同时,模型可进一步结合基因组数据,提升预测精度,并探索个体化干预策略。

 

提供多种神经疾病相关动物模型,包括阿尔茨海默病、帕金森病等,支持疾病机制研究与药物开发。

 

结语
本文开发并验证了基于健康记录数据的早发性痴呆(EOD)风险预测模型,利用多中心队列数据及机器学习技术,实现了高判别能力与跨人群适用性。研究通过CatBoost和Random Forest算法构建模型,显示出在不同人群和环境中的稳定性与公平性。关键预测因子包括年龄、就业状况和教育水平,这些变量在临床访谈中易于获取。模型在真实世界环境中具有潜在的广泛适用性,特别是在社区筛查和初级医疗场景中,为EOD的早期识别和干预提供了实用工具。未来研究需进一步验证其在不同健康体系中的表现,并探索模型与基因数据的整合,以提升个体化预测能力。

 

文献来源:
Xuewen Rong, Weijin Zhang, Shanjie Luan, Jun Liu, and Liming Shu. Real‐world prediction of early‐onset dementia by health record data: A multi‐center machine learning study. Alzheimer's & Dementia.