《中国科学报》:深圳医疗健康大数据创新应用国际大赛:唤醒“沉睡中的”医疗大数据
日前举行的深圳医疗健康大数据创新应用国际大赛成为一个时空穿越的“虫洞”。在这里,作为参赛选手的东南大学仪器科学与工程学院教授刘澄玉带领团队,正在对来自不同医院重症监护病房(ICU)的148名心梗患者心电信号的数据挖掘分析方法与算法进行阐述。
他们建立的冠心病早期预警模型检测准确度超过90%,这一成绩帮助刘澄玉团队在此次比赛中获得创新组冠军。以过去从不同地点汇集的海量数据,完成对未来健康情况的预测,类似的工作也在14个团队中展开。
心血管疾病一直以来是危害人类健康的重大系列疾病,发病难以预测,并且一旦发病难以救治。同时,各大医院、生物医药相关产业虽保有心血管疾病患者的海量数据及影像病历,却缺乏对数据的有效利用。
作为一线医生,中国人民解放军总医院心血管内科主任医师卢才义迫切期待:“大数据和人工智能的发展让我们有更好的手段、理论,将心血管疾病研究进行得更加深入、彻底。”
挖掘海量“尚在沉睡中的”医疗数据,通过大数据和人工智能技术建立有效的心血管预测模型,成为本次大赛举办的初心。“中国有人群、人口数量样本的优势,意味着我们在医学大数据研究上具有先天优势。”大赛程序委员会主席、中科院深圳先进院研究员李烨表示。
经过层层筛选,研究ICU多导生命体征数据的高精度特征扫描技术的刘澄玉团队进入决赛。决赛中,研究人员采用ICU 24小时动态心电特征的高精度连续扫描方法及在此基础上的多时间尺度心率变异性(HRV)分析技术,并通过人工智能方法将特征进行有效筛选和组合,建立冠心病早期预警模型。
“我们希望能为临床医生提供可靠、可信、可用的信号指标。”刘澄玉告诉《中国科学报》记者。
个人健康医疗信息最为敏感,属于隐私保护范围。如何既保证数据真实可靠,又对隐私安全,成为当前健康大数据开发的一道难题。
数据“脱敏”是一个有效的解决方案。为此,承办此次比赛的中科院深圳先进院在超过一年半的前期准备中,汇集了深圳全市60多家公立医院和600家社区累计超过8年、覆盖1800万人的电子病历数据,包括近10万人100多万份心脏彩超影像数据,及近100万小时ICU监护波形数据,并完成数据脱敏、可用性探查、数据清理、关联、质量控制等工作。
“我们将不同医院、不同系统的零散医疗数据进行串联、融合,最终梳理成为参赛队员可以直接挖掘的数据。”大赛程序委员会副主席、中科院深圳先进院研究员蔡云鹏对《中国科学报》记者表示。
本次大赛首次尝试在政府监管下将医院内的医学信息提供接入许可给高校、科研院所以及企业进行开发和应用。“所有数据都进行了脱敏处理,选手只能远程操作不能下载。”李烨介绍。
在科研人员看来,我国健康大数据产业化不仅需要突破诸多科学问题,还涉及复杂公共利益,切实可行的发展模式仍在探索中。