AI大模型在应用场景落地过程遇到的挑战,在医疗场景下几乎都存在,甚至时常表现得“尤为突出”。
针对医疗AI通常的可解释、可溯源功能需求,部分技术企业基于积累的通用医学知识预训练大模型,采用多Agent+ReAct思维链跟随的结构,提升大模型诊断准确性,并补充发现和解释患者可能存在的疾病,得到医疗专家的认可。
过去一年,中国国内的AI大模型行业应用出现了井喷式增长。北京市尤为重视AI的发展,出台了一系列举措,加上得益于拥有丰富的科技资源和创新环境,在AI应用领域已经形成了完整的创新和产业链条。
近日,北京市科委、中关村管委会发布了《北京市人工智能大模型行业应用分析报告》(以下简称《分析报告》),向市场呈现了北京市AI大模型创新应用发展态势,并寻求向全国乃至全球贡献“北京智慧”和“北京方案”。
该《分析报告》以近期举办的北京市人工智能行业大模型创新应用大赛为切入点进行了介绍,聚焦政务、金融、产业升级、医疗、文化教育、智慧城市6个赛道进行了系统分析和阐述。
《分析报告》关于医疗AI的相关内容摘编如下,供医疗界同仁了解和决策参考。获取完整报告可关注:领医知识岛(ID:LYZSD666)
《分析报告》介绍了北京市人工智能行业大模型创新应用大赛在医疗领域的两个赛题方向及完成情况。这两个赛题方向分别由北京协和医院、北京友谊医院提出。
再比如,在辅助诊疗中要求医疗大模型具备可解释和可溯源功能。不同疾病专科的诊疗思路和治疗方式差异大,但共同点是明确诊疗依据,加强诊断准确性。部分参赛企业基于积累的通用医学知识预训练大模型,采用多Agent+ReAct思维链跟随的结构,提升大模型诊断准确性,并补充发现和解释患者可能存在的疾病,得到医疗专家的认可。
二、
场景落地遇重重挑战
当然,意料之中的是AI大模型应用必然面临一些挑战。《分析报告》就列举了一些:
算力需求持续增长,掣肘大模型落地应用;知识产权、数据隐私与大模型应用之间的最佳平衡点仍在探索中;大模型幻觉问题有所改善,但距离规模落地尚有差距;部分大模型应用处于“可用阶段”,需求方和技术企业协同发力让“可用”迈向“好用”;部分领域积极响应监管需要,对大模型落地提出特殊要求。
AI大模型应用遇到的上述挑战,在医疗场景下基本上都存在,甚至时常体现得“尤为突出”。
比如,大模型训练涉及的数据可能包括一些版权保护的作品,可能需要禁止使用,避免生成侵权回答。然而,面对数量庞大、来源各异、权属不同的训练数据,若采用事先授权许可的方式则过程漫长、复杂且几乎无法落地操作。
在数据隐私保护方面同样如此,它与大模型应用之间的技术平衡点也仍然在探索中,目前还存在一个两难的问题——既要最大限度地保护数据隐私,又要最大限度地发挥大模型的效果。
这种矛盾在政务、医疗和金融领域尤为突出。如何通过开发可信的框架,从而在“既要……又要……”的困难中取得一种平衡,是目前业内讨论的重点方向,仍在探索中。
再比如,金融、医疗、教育等领域在政策、数据隐私、伦理安全等方面有较高监管需要,需求方和技术企业积极响应,在凝练场景、开放数据、模型训练等过程中考虑监管因素,在项目交付时考虑所属领域可能存在的特殊要求。
领医知识岛(ID:LYZSD666)注意到,在此次由北京协和医院、北京友谊医院分别出题的复赛中,就出现了两种数据使用情形。
协和医院赛题方向的复赛所用训练数据集由重症医学领域知识文献、操作指南、专业试题库和入院病历样例四部分组成,不涉及患者临床信息,通过脱敏处理后可供参赛企业带回,进行部署调试。
“北京方案”给出三个研判、三个建议
医疗领域核心场景重视准确性及可解释性;医疗数据治理面临隐私及标准化的挑战;医疗机构私有化落地成本较高。
比如,诊断场景作为医疗领域的核心场景,需要大模型结果准确、可回溯、可验证。这对技术企业提出了更高的要求。不少技术企业将大模型尝试应用于科研及教学环节,推动医疗AI更快实现应用落地。
在医疗数据治理层面,当前医疗AI产品训练所需的基础数据,均来源于医疗机构在不同时期逐步部署的异构信息系统,不同医疗机构之间的数据仍难以互联互通、共享共用,这些都阻碍了进一步分析利用。同时,对医疗数据的严格管理、保护,都限制了AI大模型在医疗领域的商业化落地。
此外,大模型在资金、时间、算力、硬件设施和环境等方面具有高昂的开发和运营成本。这些无疑都对医疗机构私有化部署医疗大模型增加了难度。《分析报告》提出了AI大模型在医疗领域发展的三条建议:
一是,从医疗全流程入手,开放有价值业务场景;二是,推动构建北京市医疗大模型公共数据集;三是,大模型技术企业与医院IT解决方案供应商加强合作。
比如,从开放业务场景方面,《分析报告》认为从加快场景落地考虑,在持续推进医疗诊断等核心业务的同时,拓展医疗行业全领域业务场景,从互联网诊疗、诊前诊后全流程管理、科研场景、民营医院入手,鼓励本市大模型团队找准行业或场景数据优势错位发展,探索大模型在医疗领域的商业化模式和产业化发展路径。
再比如,在推动构建北京市医疗大模型公共数据集方面,《分析报告》认为:协同各类主体加快构建高质量的医疗领域公共训练数据集,推动医疗数据泛知情同意,按照尽职免责原则实现数据出院。在有效提升医疗数据的质量方面,《分析报告》也给出了较细致的建议。
此外,关于大模型技术企业与医院IT解决方案供应商加强合作方面,《分析报告》认为:医院通常有固定合作的IT解决方案供应商,其他技术企业全新建立与医院的合作关系较为困难。大模型技术企业需要结合自身的技术特征、目标场景等要素,选择合适的医院IT解决方案供应商进行合作。
四、
多数需求方认可大模型价值
RAG、智能体、多模态技术有明显作用
尽管遇到的挑战重重,但是也不乏一些能够带来信心的信息。《分析报告》就概述了现阶段AI大模型应用呈现出的一些典型特征:
大模型穿越边缘场景,向核心场景挺进;央国企拥抱新技术,加快大模型在产业升级、金融等领域的落地步伐;大模型应用搭建难度下降,“动态行业大数据”成为落地新关键;需求方情况各异,在采购、部署大模型时特色鲜明;大模型安全逐渐受到重视,为可持续发展提供保障。
比如,经过近一年的高速发展,AI大模型在政务、金融、产业升级、医疗等各个领域均有落地应用。在产业升级领域,以知识问答、代码补全等场景为主;在文化教育领域,以内容润色、内容纠错等场景为主;在医疗领域,以医疗文书生成、智能医药问答等场景为主。
上述场景大多为所属领域的边缘场景,不涉及生产、运营的核心环节,也不面向公众或外部客户使用,仅面向内部员工使用。不过,得益于在边缘场景价值的成功验证及其技术演进,大模型也开始向核心区挺进。
在场景价值验证方面,多数需求方认可大模型价值,将计划追加投入。整体而言,大模型技术演进主要包括检索增强生成(RAG)、智能体(AI Agent)和多模态,对扩大大模型应用范围有明显作用。
检索增强生成技术(RAG)主要用于解决大模型幻觉问题;智能体技术(AI Agent)则可以实现大模型应用的能力升级,赋予大模型感知、规划、记忆和使用工具的能力,实现独当一面。
多模态技术则是使交互模态扩展至文本、图片、音频、视频等多种模态,可显著提升大模型应用的产品功能和交互体验,推动大模型应用从可用向好用转变。
声明:转载仅做分享,本文著作权归原创者所有,如有侵权请联系小编进行删除。