人工智能(artificial intelligence,AI)赋能医疗,通过提升临床诊疗效率和服务质量,缓解医疗卫生资源短缺和不均衡等问题。医疗机构、科研院所和企业多方联合攻坚,希望借鉴AI在翻译、金融和安防等领域的成功经验,实现医疗领域的重大变革。本文拟梳理医疗AI的发展历程,探讨目前存在的挑战及未来发展方向。
1、医疗AI发展历程
医疗AI从时间线上大致分为知识驱动和数据驱动两个阶段。1956年至1987年,科学家们聚焦于知识驱动体系,赋予计算机逻辑和因果推理能力,从而创造了以专家知识库为主的一系列研究成果,如辅助内科疾病诊断系统等。然而,随着医疗数据信息化和复杂度的不断提升,基于知识驱动的研究范式无法支撑进一步的智能化。1993年至今,以数据驱动的研究和应用开始逐步占据主流,深度神经网络以其优越的数据拟合能力,在电子病历、生理信号和医学影像等方面均有突破:基于自然语言处理(NLP)、图神经网络(GNN)和医疗知识图谱(KG)技术,对电子病历中的文本数据进行解析和建模,可实现疾病智能问诊、辅助诊断、治疗推荐和预后预测等;基于循环神经网络(RNN)对心电和脑电等生理信号进行分析,聚焦于实现心脑血管疾病的预警和诊断;基于影像组学(Radiomics)、卷积神经网络(CNN)和生成对抗网络(GAN)技术,对医学影像进行分析和学习,实现病灶的定位、检测、分割、分类以及图像重建等。
2、医疗AI目前的困境
目前AI以数据、算法和算力为三大核心,海量医疗数据、成熟的深度学习算法和GPU算力作为支撑,在多个病种中均有突破性进展。但同时也面临算法理论、数据标准化、产学研差异化和政策监管等多方面的问题,共同导致了目前AI并未真正融入到临床业务流程中。
医疗海量数据不断产生和硬件算力的提升,使得基于数据驱动的深度学习体系,在疾病的早期筛查、精确诊断、疗效预测和预后评估等方面逼近甚至超过临床专家。但与此同时也应认识到,AI目前以数据为核心,其内涵的“黑盒”机制一直无法得到解决,甚至无法被解释,导致AI虽然有很好的预测效能但无法形成因果结论。因此,目前AI局限于具有海量、高质量数据的病种,而罕见病等小样本疾病一直无法得到有效开展。
医疗机构缺乏有效数据共享、互通机制,医疗数据的生产、收集和标注缺乏统一标准。在数据生产和收集方面,电子病历数据面临缺失、规范性和差异性问题,不同地区和医院的信息化程度、诊疗依据和标准不同;生理信号的数据主要面临不同设备厂家之间的差异性,问题相对较小;医学影像面临仪器、检查参数、检查场景和影像质量等诸多问题,以标准化程度相对较高的放射影像为例,存在设备品牌众多、不同医院检查参数与扫描技术存在差异、门诊与住院检查侧重点不同等问题。在数据标注方面,除病理、免疫组化、疾病复发、生存等金标准外,临床分期、评级、评分和病灶分割等结果的标注,由于疾病的诊疗标准和指南存在多样化、差异化和不断演变与更新,容易参杂医生的主观因素,未形成统一体系。
由于以深度学习为代表的AI算法,在理论上遭遇无法解释的瓶颈,企业、科研院所和医疗机构的发展内涵也发生了变化。企业以高质量大数据为核心,结合成熟的AI模型形成产品级别的解决方案,通过与更多的医疗机构合作获取更多疾病的诊疗数据,完善产品的丰富度;科研院所从理论和应用两个方面发展,理论研究聚焦于可解释性和隐私计算,应用研究聚焦于修改、优化和训练成熟的模型,以适应特有疾病的应用场景;医疗机构在AI发展初期以提供临床思路和数据为主,但随着AI技术的普及,临床专家们不再仅仅关注疾病的预测效能,希望结合AI技术探索疾病进展过程中机制、分子和基因等更深层次的理解。
随着医疗AI的快速发展,可信度、责任分担机制和伦理等政策监管方面的问题日益凸显。医疗AI研究和应用缺少严格的随机双盲对照实验和多中心、前瞻性验证,可信度有待加强;针对患者级别的诊断,企业、医院和临床医生的责任分担机制暂不明确,导致目前的医疗AI产品无法收费,且聚焦于定量分析任务,如病灶区域分割与检测、临床辅助决策系统,医生可根据经验对结果进行复核和确认,而更重要的定性分析任务更多停留在科研层面,如患病风险、进展的预测等;基于数据驱动的医疗AI,涉及大量不同人群的全生命周期信息,隐私保护和种族歧视等伦理问题面临严峻挑战,相关政策法规陆续出台。
3、医疗AI未来展望
基于数据驱动的深度学习方法,在医疗AI的理论和实践中得到验证,是目前唯一成熟、可大规模应用的技术手段。同时,众多研究者也充分认识到医疗AI在应用、理论和临床研究中还有很长的路要走。
医疗AI技术变革及临床转化方面虽然面临数据标准化和政策监管的问题,但随着医疗信息化互联互通、规范化的建设,数据、应用场景的标准化问题以及政策监管问题将会逐步得到解决。然而,规范化、标准化的信息化建设需要很长时间,现阶段医疗AI仍需坚定不移的从深度和广度两个方面发展,深入到临床诊疗环节中,完善多中心数据库建设,构建多病种的AI模型,形成多部位、多模态的一体化疾病诊疗方案,赋能区域基层医院。深度方面,从嵌入核心环节到全链条AI诊疗方案,以脑卒中为例,将放射科的脑卒中AI应用和神经内科的临床辅助决策系统融合到移动卒中单元中,快速实现患者的诊断、病情评估和治疗方案推荐,为急诊医生的诊疗节省宝贵时间。广度方面,使基层医院具备更高的诊断水平,实现疾病的早诊、早治,助力精细化分级诊疗体系,如眼底糖网病、肺结节检测、糖尿病等慢性疾病在基层医院逐步落地,并结合智能问诊和随访管理系统,实现患者的标准化和同质化管理。
医疗AI理论方面,以突破可解释性、小样本学习和隐私计算三大难点为主。虽然有SHAPE和CAM方法对临床和影像AI模型进行解释,但并不能阐明AI模型与疾病的因果关系。为探索AI模型可解释性,可从三个方面进行深入研究:①继续深耕深度学习算法,从数学角度去解析其理论机制从而构建因果关系,但并无实质性进展;②抛弃已有的深度学习模型结构,另起炉灶从源头构建因果推理模型,如结构因果模型、潜在结果模型等;③融合推理和学习的深度学习算法,实现应用级别的可解释,如案例推理和图神经网络等。小样本学习本质是从有限的有监督信息中学习以获得解决任务的能力,可解决罕见病等数据量比较少的疾病研究和减少数据标注的工作量,为后续的大规模应用做铺垫,如元学习等。隐私计算用于解决数据保护和利用两难的问题,采用云边协同方式进行训练与推理,从源头上保护数据的安全性,加速大数据和大模型的构建,从而提升医疗AI模型的准确性和泛化性能,如联邦学习等。
医疗AI临床研究方面,以数据、应用可解释性和生物学含义为重点。医疗数据的数量和质量对目前的医疗AI至关重要,因此需要临床专家积极推动多中心、规范化专病数据库建设并形成指南、共识,如“胸部CT肺结节数据标注与质量控制专家共识”等。医疗AI的实际应用效果已得到广泛认可,但其因果性一直无法得到解决,可以从应用和机制的可解释性去深入挖掘AI含义。应用可解释性,从心理学、哲学角度去论证相关性的循证医学理论,让人们信赖医疗AI,如皮肤癌AI应用的多队列论证实验。生物学含义,随着医疗AI的发展,研究者们聚焦于提升模型的预测能力,而对于其生物学意义的理解越来越少,限制其广泛的临床转化,因此需要探索预测指标与微观特征或机制之间的联系并进行生物学验证。
总体而言,随着理论、应用和政策的完善,医疗AI将深入到临床诊疗路径中,不断提升医生的诊疗质量和效率,让医生有更多的时间和精力,真正从“以疾病为中心”向“以患者为中心”转变,推动疾病诊疗关口前移。