Cancer research
基于多中心组织图像整合与多尺度深度学习的儿童肉瘤分类

2026-02-17

研究领域分类

免疫（401）肿瘤（512）代谢及心血管（384）神经及肌肉（515）眼科（35）其他（511）

加入邮件订阅!

您将获得赛业生物最新资讯

小赛推荐：

该研究开发了一种高效的计算管道，利用多中心全切片图像数据和先进的视觉Transformer模型，实现了对儿童肉瘤亚型的高精度分类，同时显著提升训练速度并降低硬件需求。

文献概述

本文《Multicenter Histology Image Integration and Multiscale Deep Learning Support Machine Learning-Enabled Pediatric Sarcoma Classification》，发表于《Cancer research》杂志，回顾并总结了针对儿童肉瘤诊断难题所提出的基于数字病理图像的深度学习解决方案。研究团队整合来自多个医疗中心及儿童肿瘤组的867张全切片图像，构建了一个高度多样化的数据集，并通过图像标准化与批效应校正策略确保模型泛化能力。采用先进的视觉Transformer模型（如UNI、CONCH）作为特征提取器，结合SAMPLER方法生成统计表示，实现了对横纹肌肉瘤（RMS）与非横纹肌肉瘤软组织肉瘤（NRSTS）以及RMS亚型的精准分类。最终模型在无需GPU的情况下训练速度比传统Transformer架构快三个数量级，展示了其在资源受限环境下的应用潜力。整段通顺、有逻辑，结尾用中文句号，段落结尾使用

背景知识

儿童肉瘤是一类罕见但临床异质性极强的间叶源性恶性肿瘤，包含超过70种组织学亚型，其准确分类对治疗决策至关重要。传统诊断依赖于组织形态学评估和免疫组化，但许多亚型间形态重叠明显，常需分子检测（如基因融合分析）以明确分类。例如，横纹肌肉瘤中PAX3/7-FOXO1基因融合的存在提示预后较差，指导更积极治疗。然而，这类分子检测成本高、周期长，且受限于专业平台，导致全球范围内诊疗不均。近年来，深度学习在数字病理图像分析中展现出巨大潜力，尤其在肿瘤分类与预后预测方面。已有研究尝试使用卷积神经网络（CNN）对肉瘤进行分类，但多数局限于单一机构数据或特定亚型，缺乏跨中心泛化能力。此外，全切片图像（WSI）尺寸巨大，直接处理计算开销高，现有基于注意力机制的模型虽性能强，但依赖GPU且训练缓慢。因此，如何在保证模型泛化性的同时降低计算成本，成为推动AI在临床落地的关键挑战。本研究通过多中心数据整合、图像标准化流程与SAMPLER表示学习框架，提出了一种兼顾准确性与效率的解决方案，为儿童肉瘤的智能辅助诊断提供了新范式。段落结尾使用

针对阿尔茨海默病、脊髓性肌萎缩、视网膜色素变性等罕见病，可提供HUGO-GT®全基因组人源化模型，搭载了更高效的大片段载体融合技术，可以作为万能模板进行针对性的突变定制服务，是更贴近真实世界生物机制的药物临床前研究模型，我们期待与你共同开发新型全基因组人源化小鼠，加速基因治疗研究

研究方法与实验

研究团队收集了来自圣犹大儿童研究医院、麻省总医院、耶鲁大学医学院、儿童肿瘤组及华盛顿大学的H&E染色全切片图像，共计867张，涵盖10种儿童肉瘤亚型。所有图像经过统一格式转换、聚焦质量评估、分辨率标准化与染色归一化处理，确保跨中心数据一致性。采用自动对象识别（AOI）工具定义组织区域，并通过STQ流程进行分块处理。使用四种深度学习骨干网络（InceptionV3、CTransPath、UNI、CONCH）提取图像块特征，再通过SAMPLER方法将每个图像的特征分布压缩为10个分位数的向量表示。分类模型采用逻辑回归与SVM进行训练，并在不同图像尺度、分块大小与分辨率组合下进行参数优化。同时，研究对比了基于Transformer编码器的端到端模型与CLAM模型的性能与训练效率。

关键结论与观点

整合来自多个医疗中心的867张全切片图像，构建了目前最大规模的多机构儿童肉瘤图像数据集，显著提升了模型的泛化能力
采用SAMPLER方法对图像块特征进行统计汇总，形成固定长度向量表示，有效降低存储与计算开销，同时保留组织异质性信息
视觉Transformer模型UNI和CONCH在特征提取任务中显著优于传统CNN与CTransPath模型，在区分胚胎型与肺泡型横纹肌肉瘤任务中AUC分别达到0.959和0.958
多尺度特征融合策略进一步提升分类性能，在RMS亚型分类任务中AUC达0.961，RMS与NRSTS分类AUC达0.969
相比基于Transformer编码器的模型，SAMPLER+逻辑回归流程在无GPU环境下训练速度提升超过1000倍，模型体积更小，推理更快，更适合临床部署
构建的两阶段分类管道可有效识别罕见的尤文肉瘤，AUC达0.929，展示了对不平衡数据的良好适应性
模型在外部非儿科肉瘤数据集上零样本测试准确率达93.75%，验证了其潜在泛化能力

研究意义与展望

本研究展示了深度学习在儿童肉瘤病理诊断中的巨大潜力，通过多中心数据整合与高效表示学习策略，解决了传统AI模型泛化性差与计算成本高的问题。所提出的SAMPLER框架不仅适用于肉瘤分类，也可推广至其他罕见肿瘤或复杂病理诊断任务。未来工作可进一步扩展数据集覆盖更多亚型，并探索与分子特征的多模态融合，提升诊断准确性。此外，该轻量级模型结构适合集成至数字病理平台，实现本地化部署，助力基层医疗机构提升诊断水平。

尽管模型性能优异，但仍存在局限。例如，所有图像均由原机构提供诊断标签作为真值，可能存在跨中心诊断标准差异。未来应引入独立病理评审以进一步验证模型性能。同时，当前模型为图像级别分类，缺乏空间解释性。结合可解释AI技术生成热图，将有助于病理医生理解模型决策依据，增强临床信任。总体而言，该研究为AI辅助儿童肉瘤诊断提供了坚实基础，推动了精准医学在儿科肿瘤中的应用。

专业的眼科药效学分析平台可提供从眼部注射给药、眼部活体检测、眼部组织取材、病理学分析和基因与蛋白表达分子检测等全流程的眼科药效学分析服务

结语

本研究成功构建并验证了一种基于多中心组织图像整合与多尺度深度学习的儿童肉瘤分类系统。通过整合867张来自多个机构的全切片图像，采用先进的视觉Transformer模型（UNI、CONCH）结合SAMPLER表示学习方法，实现了对横纹肌肉瘤及其亚型的高精度分类，AUC值分别达到0.969和0.961。研究特别强调了图像标准化与批效应校正在提升模型泛化能力中的关键作用。相比传统基于注意力机制的Transformer模型，该方法在无GPU环境下训练速度提升三个数量级，显著降低了计算资源门槛。此外，两阶段管道有效识别了罕见的尤文肉瘤，展示了对类别不平衡的良好鲁棒性。该轻量级、高效且高精度的计算框架为儿童肉瘤的智能辅助诊断提供了可行路径，尤其适用于资源受限的临床环境。未来工作将聚焦于多中心前瞻性验证与可解释性模块开发，推动该技术向临床转化。

文献来源：

Adam H Thiesen, Sergii Domanskyi, Ali Foroughi pour, Jeffrey H Chuang, and Jill C Rubinstein. Multicenter Histology Image Integration and Multiscale Deep Learning Support Machine Learning-Enabled Pediatric Sarcoma Classification. Cancer research.

更多热门文章推荐

Cancer research
MDC1介导的DNA修复功能障碍赋予小叶乳腺癌对PARP抑制剂敏感性

Blood
骨髓微环境空间区室重塑介导炎症对造血调控的影响