复旦大学数据智能与社会计算实验室发布了中文医疗健康个人助手DISC-MedLLM。该模型在单轮问答和多轮对话的医疗健康咨询评测中表现出色,相比已有医学对话模型具有明显优势。
据介绍,当患者感到身体不适时,可以向模型问诊,描述自身症状,模型会给出可能的病因、推荐的治疗方案等作为参考,在信息缺乏时会主动追问症状的详细描述。除此之外,用户可以还基于自身健康状况,向模型提出需求明确的咨询问题,模型会给予详尽有助的答复,并在信息缺乏时主动追问,以增强回复的针对性和准确性。用户还可以询问与自身无关的医学知识,模型会尽可能专业地作答,使用户全面准确地理解。
复旦大学研究团队采用两阶段训练方法训练DISC-MedLLM医疗健康个人助手。第一阶段研究团队使用MedDialog、cMedQA2等数据集进行监督微调,同时加入通用数据集增强语言表达能力。第二阶段使用行为偏好小样本数据集进行微调,进一步提高模型表现。相关负责人介绍到,DISC-MedLLM医疗健康个人助手有三大特点:
1)可靠丰富的专业知识,基于医学知识图谱采样获得;2)多轮对话的问询能力,基于真实咨询对话重建;3)对齐人类偏好的回复,通过筛选生成高质量小样本指导模型。DISC-Med-SFT数据集利用通用大模型的语言能力,围绕这三个方面进行针对性强化。
早在5月25日,医联抢先就发布了自主研发的基于Transformer架构的国内首款医疗大语言模型MedGPT。其主要致⼒于在医疗场景中发挥实际诊疗价值,实现从疾病预防、诊断、治疗、康复的全流程智能化诊疗能力。 此外,医联还建立了基于专家评议的AI诊疗准确性与真实世界医⽣对标测试机制,不断将AI与真实诊疗场景对齐,最终实现准确诊断。
随着远程医疗的兴起,在线问诊咨询越发成为患者寻求便捷高效的医疗服务的主要需求。在医疗行业,大模型技术应用更是被广泛看好,诸如提供辅助诊断与辅助治疗、医疗文书的自动化生成与处理、互联网问诊等场景等得到了展望,为健康医疗助手走进人们的生活带来了希望。
目前,大模型已被广泛应用于药物研发、基因组学、医学图像处理等方面。据悉,微软和Epic Systems就宣布,将GPT-4引入医疗保健领域,用于医护人员对患者的消息回复,分析医疗记录,以及寻找新的趋势。此外,谷歌过去几年里也一直在探索如何用AI来改善医疗保健,比如帮助早期发现疾病,扩大医疗服务范围等等。现如今,大语言模型技术正处于飞速发展阶段,医疗行业也势必因此而发生巨大的变化。产业分析机构IDC在医疗大模型研究中就认为:
在大模型在医疗行业落地中,大模型技术将逐步发展成为一种技术能力来支撑医疗软件的运行,未来长期发展中,大模型将驱动整个医疗IT系统架构的升级,成为医疗信息化架构的重要组成部分。
大模型在医疗行业应用的落地,离不开医疗信息化作为基础。今年1月,工信部等十七部门发布《“机器人+”应用行动实施方案》,该政策提出到:
2025 年,服务机器人行业应用深度和广度要显著提升。适逢当下国内外的大模型纷纷推出,包括商贸物流、医疗健康、养老、商业社区服务等多个机器人行业赛道都成为类大模型技术落地的掘金地。
产业分析机构IDC在医疗大模型研究就提出,大模型技术在医疗软件上的应用,将会带来医疗软件架构的升级。当前,一体化架构的医疗软件成为主流,数据中台架构获得广泛认可和应用,基于微服务等云原生的技术架构也在快速发展,而大模型技术的应用,将会促进建立人工智能开发平台,其将数据中台和云原生技术中台串联起来,通过数据中台、大数据技术、湖仓一体技术等建立大数据,在人工智能平台搭建训练模型,而训练后的输出则是通过服务的模式嵌入到医疗软件中。所以,AI开发与训练技术将会与大数据技术和云原生技术构成医疗软件架构的新后台,新后台将成为医疗软件架构升级的重点,成为未来医疗软件能力的源泉和源源不断的动力。
除此之外,大模型技术的落地应用,产生了医疗大数据平台与大数据治理的需求,并产生了计算算力的需求,大模型应用的部署则促进云原生技术的发展。所以医疗大模型的发展,将会促进医疗IT基础设施全面转向云基础设施,包括医疗云IaaS的部署和PaaS的部署,多云形成混合云的态势将加速发展。