深圳先进院等开发首个脑胶质瘤数字病理整合诊断AI模型
近日,中国科学院深圳先进技术研究院医学成像科学与技术系统重点实验室李志成研究员团队联合郑州大学第一附属医院病理科主任李文才团队、神经外科主任刘献志、闫东明团队、首都医科大学宣武医院病理科主任滕梁红团队以及河南省人民医院团队开发出一种新型的脑胶质瘤人工智能病理整合诊断系统。这一人工智能诊断系统以数字病理图像为输入,以2021年最新发布的第5版《世界卫生组织中枢神经系统肿瘤分类》为诊断标准,直接输出符合最新指南的整合诊断结果,精度达到了可比拟人类病理学家的水平。 研究成果以Neuropathologist-level integrated classification of adult-type diffuse gliomas using deep learning from whole-slide pathological images为题发表于于近期的Nature Communications杂志上。
脑胶质瘤是最常见的成人原发性脑肿瘤,其诊断金标准是术后病理切片检查。病理学家在显微镜下观察切片,根据组织学形态特征进行分类和诊断。但脑胶质瘤组织病理分类与预后、肿瘤生物学行为、遗传背景并不一致。随着2021年世界卫生组织(WHO)第五版中枢神经系统肿瘤分类标准的发布,脑胶质瘤病理诊断迎来革新,正式迈入组织病理和分子病理整合诊断时代。依照最新指南,必须结合组织学特征和分子标志物,才能最终确定脑胶质瘤的类型和级别。脑胶质瘤整合诊断着重强调了分子信息的关键作用。实施整合诊断需要检测多个分子标志物如IDH突变、1p/19q共缺失等,涉及Sanger测序、FISH检测等分子病理检测技术,耗时耗力且技术要求较高,整合诊断流程如图1所示。在临床实际中并非所有患者都有条件进行整合诊断。如果能从病理图像中直接确定整合诊断类型,将有可能省掉分子病理检测的环节,无疑非常有临床意义。
数字病理图像智能分析技术在一些重大疾病的精准诊断中展示出巨大应用前景。然而,将人工智能技术应用于脑胶质瘤的整合诊断仍然极具挑战,主要原因是脑胶质瘤形态学和基因型并不总是一致的:形态学相似可能基因型不同、形态学有差异可能基因型相同。新指南中的病理类型已经不是单纯的组织学类型,而是融合了组织特征和分子特性的WHO“整合”类型。以IDH野生型胶质母细胞瘤来说,只要组织学判定为弥漫性胶质瘤且IDH为野生,再加上EGFR扩增、TERT启动子突变、7号染色体获得/10号染色体缺失三者中的一个,就可确诊为胶质母细胞瘤,而不再完全依赖于微血管增生或坏死等典型组织学特征;而就算有微血管增生或坏死,如果是IDH突变,也要划分为IDH突变的星形胶质瘤4级,而不能像上一版指南一样划分为胶质母细胞瘤。这就打破了原来组织学病理类型和级别的界限,为数字病理图像智能分析算法带来了很大挑战。例如,算法即使识别出了微血管增生或坏死等形态学特征,也不能据此做出分类,还要能够从图像模式中识别出底层的分子改变,才能得出预测结果,这无疑对算法的表征能力提出了很高的要求。
为此,研究团队共收集了来自三家医院的2624例成人弥漫性脑胶质瘤患者数据,包括全切片病理图像和WHO第五版指南所需的全套分子病理检测数据。人工智能团队与临床医学专家开展了卓有成效的合作,利用超过110万张病理分块图像成功开发出基于图像特征聚类的整合诊断模型,目前这一模型已经开源。前期研究发现,对于数亿像素规模的全切片病理图像,复杂的深度网络设计在面对多样性的病理模式时可能学习不到对诊断最为关键的信息,导致分类精度在不同数据集产生较大波动;在组织病理学分类任务中表现良好的模型在整合诊断任务中并未表现出理想的泛化性和预测性能。经过研究发现,高维的病理图像特征空间可能对应着不同的底层生物学信息,其中部分特征同时具备形态学特征+分子特性整合分类能力。基于这一发现,研究团队采用了聚类-分类的两步建模方法,先在特征空间选出最具表征力的图块,再进行图块级分类,最终聚合为病人最终的诊断类别。在整个流程中,可重复性和稳定性是重点考虑内容。该方法无需在病理图像上事先人工标注感兴趣区域。
实验结果显示,该方法在内部验证集和两个外部测试集都取得了很好的分类结果,而且比其他常见模型具有更高的准确性。图3显示了对于病理专家也很难或无法区分的“困难任务”典型病例,人工智能算法可以得到准确的结果。
这一突破性的研究成果可能推动人工智能病理整合诊断领域的发展,为数字病理整合诊断打开了新的可能性。需要指出的是,本研究的结果并不能直接得出取代分子病理学检测的结论,在临床诊断中分子病理学检测仍然是分子诊断金标准。但在需要快速做出初步判断、分子病理学检测不适用等场景下,基于人工智能的计算病理学算法则可以发挥其独特优势:不需要分子病理检测,直接从数字病理图像中利用人工智能算法迅速判断出最有可能的整合诊断结果,从而为后续的诊疗决策提供支持。
王伟伟、赵源深、滕梁红和阎静为论文第一作者,李文才、李志成和张振宇为论文的通讯作者。
图1. WHO第五版指南推荐的成人弥漫性脑胶质瘤整合诊断流程
图2. 脑胶质瘤人工智能病理整合诊断系统的数据集和算法流程
图3. 人工智能算法对于困难任务的准确分类结果,例如组织病理学特征相似但分子病理不同,导致诊断结果不同等WHO新指南中特有的情况