欢迎访问智慧医疗网 | 网站首页
 
当前位置:首页 > 咨询 > 分析

DeepSeek如何落地医疗领域且“深度定制”医疗?

发布时间:2025-03-20 来源:前元投资 浏览量: 字号:【加大】【减小】 手机上观看

打开手机扫描二维码
即可在手机端查看

近一个多月以来,DeepSeek掀起的AI大模型之风已经席卷医疗行业的各个细分赛道。

DeepSeek的强大推理能力意味着它不仅仅是一个更智能的问答助手,而是有可能真正“理解”医学知识并推导诊疗方案,从而在医疗行业产生以下几大变革:

1.智能化辅助诊断DeepSeek可以利用深度学习对大量医学文献、病历和影像数据进行训练,并在此基础上实现更精确的辅助诊断。相比传统AI,它能更深入地理解病因、病理,并结合患者个体情况给出合理的诊断建议,减少误诊和漏诊的可能性。

2.自动化病历书写目前医生的病历书写工作繁重,而DeepSeek的自然语言处理能力可以大幅度提升这一流程的效率。例如,医生在查房或问诊过程中,DeepSeek可以自动生成完整、符合医疗规范的病历,同时确保符合医保和院内管理标准,减少人工整理病历的工作量。

3.医学影像智能分析在影像科、病理科等科室,DeepSeek可以结合现有的AI影像分析技术,提升对CT、MRI、病理切片等图像的识别准确率,提高疾病筛查和诊断效率,尤其适用于肿瘤、肺结节等疑难病例的筛查。

4.精准医疗和个性化治疗方案制定传统的临床决策主要依赖医生的经验和指南,而DeepSeek可以分析大量患者数据,结合最新医学研究,提供精准医疗建议。例如,针对肿瘤患者,DeepSeek可以分析基因检测结果,推荐个性化的靶向治疗方案,提高治疗的成功率。

5.提升医疗科研效率DeepSeek能够帮助医生快速检索文献、生成科研报告、甚至自动撰写论文摘要,大幅提升医疗科研的效率。在大规模数据分析方面,它可以辅助流行病学研究,提供数据驱动的医学洞察。

医疗行业的重点企业、医院与DeepSeek展开合作,为资本市场带来生机,并带动医疗全产业链的部分上市公司股价出现大幅波动。

DeepSeek的出现,使得医疗企业借助AI大模型发展的市场认知已经逐步形成:药械企业用AI大模型精进产品的智能化;主攻医疗信息化、医药零售、互联网医疗等业务的医疗科技企业开始加速垂直领域的技术升级;医疗机构在经营困难的当下纷纷追赶高性价比的AI大模型“列车”;就连头部科技企业也将公司战略瞄准了医疗......

这场竞合之战已然打响,谁将重塑医疗服务的底层逻辑,谁又在改写医疗赛道中的游戏规则?

▌从通用到垂域

2024年11月,国家卫健委发布《卫生健康行业人工智能应用场景参考指引》(以下简称“《参考指引》”),明确84个AI应用场景,涵盖医疗服务、医院管理、药物研发到健康管理全链条。

有了《参考指引》,企业和医疗机构在进行AI大模型部署之时更有方向感。上海市第七人民医院信息科主任赵铎表示,医院年后已经进行了DeepSeek的本地化部署,目前体检报告解读、文书撰写、药物咨询等场景正在应用调试环节。

赵铎告诉记者,医院层面考虑了DeepSeek的两种应用方式,一是购买DeepSeek等AI大模型现有的功能和服务,另一种是医院自己去做相关的数据训练。“现阶段,第一种方式会根据医院的实际需求进行投入。第二种方式,利用大模型的特性去做数据的分析,从简单到复杂的场景,例如影像科PET-CT报告、体检报告的解读,制度文件、科研管理流程等形成的知识库等。”

“相对于其他大模型,DeepSeek在训练效率与成本方面表现更为出色。其优势在于显著降低了医院等终端客户对于算力和服务器的需求,这也是DeepSeek火爆出圈的重要原因之一。”河北省邢台市人民医院副书记、副院长刘登湘表示。

但即使这样,还是对医院的算力投入提出了较高的要求。医院初步部署DeepSeek算力底座为70B蒸馏版,其目标是构建基于大模型的院内知识库体系,满足30人同时访问该知识库,这部分投入达到了几十万元。有医院于2024年采购了大模型服务器,部署了671B满血版,但在实际使用效果并未达到预期,在临床终端经常出现终端卡顿的情况。

关于算力、算法和数据谁更重要的话题,艾昆纬中国(IQVIA China)人工智能和创新业务负责人张畅表示,因为医疗行业的特性决定了数据的敏感度、获取来源、专业性等有别于其他行业,且需要长周期数据,从而导致该行业数据相对更重要。因此,医疗行业是基于数据的算力和算法的商业模式之间的长跑。

多位采访对象实际操作后发现,在医疗方面,DeepSeek并没有非常专业,医院需要用医疗上的专业数据,让它变得更聪明和更专业。如果训练的数据不准确,有时会产生幻觉。

“如果用DeepSeek这类通用模型做科研,就要把通用模型变成垂域模型。”赵铎表示,未来应用于科研会复杂一些,需要庞大的基础数据,不同模态的数据。数据更加专业后,生成智能体产品用于科研领域的药物研发、中医辅助诊断等。大模型的私有化部署并非终点,模型后面的应用才有实际价值

已经构建完成智能体多年的医疗机构信息科负责人表示,三年前就已经预测了百模大战的到来,对医院各个领域的赋能,最终都是智能体,可以接任何来源模型和其他模型,重要的工作一定是本地化调优,调优和数据标注之后的成果,才是医院的知识资产。

该医疗机构负责人认为,基模大战的背后,还需要加大对医院具体应用的投入和付出。看应用场景和并发访问量,靠谱一点的应用落地,需要大量投入。

▌医疗AI行业的价值重估

与医疗机构的思路不同,其上游的医疗企业在AI大模型方面展开的竞争正在“激活”整个市场。

不同类型的医疗企业布局AI大模型的逻辑和特点各有不同。张畅表示,医药企业、医疗器械企业、医疗科技企业、医疗机构等企业或机构布局AI会结合自己的主业。

“医药企业的本质是研发,会去关注人工智能药物发现(AI Drug Discovery & Design,简称:AIDD)以及更好的商业化,即商业智能(Business Intelligence,简称:BI);医械企业大多有硬件,会思考如何添加软件或算法,甚至可能涉及通过工业化4.0去做生产优化;医疗科技企业会更多聚焦在算法层面,以及摸索应用场景;医疗机构布局大模型则是结合临床诊断或治疗的应用场景。”

张畅认为,要想成为领先的医疗科技企业,首先是能够链接上下游。尤其是到医院,结合临床数据开发合适的场景,这方面传统的医疗科技企业会比较有领先的可能性。药械企业要让医疗机构参与药企的研发,参与器械企业的整合设计。

随着越来越多参与者在AI大模型上的积极跟进,医疗行业的规则正在被重新定义。

3月8日,华为宣布正式成立“医疗卫生军团”。在此之前,华为已与众多医疗企业、医疗机构展开深入合作。

例如,在医疗信息化领域,华为与卫宁健康(300253.SZ)、万达信息(300168.SZ)、东软集团(600718.SH)等企业展开合作;在AI诊断与病理模型方面,与润达医疗(603108.SH)、安必平(688393.SH)等企业展开深入合作,还于近期与上海瑞金医院联合发布了临床级病理大模型RuiPath;在AI训练和推理方面,华为与润达医疗合作推出华擎智医训推一体机;AI药物研发领域,华为与阳光诺和(688621.SH)、泓博医药(301230.SZ)等药企合作。

在张畅看来,不可避免的参与者会有一些业务重合,例如数字化咨询和方案设计,但每个类型的企业有它自己的核心竞争力。华为这类科技企业,其优势在基础设施、本地化部署能力,以及网络安全,当然硬件相关(例如芯片等)也是它的核心壁垒,完全可以在此基础上衍生咨询服务。

“对于医疗科技企业而言,核心壁垒是对实际的医疗应用场景的熟悉,对医药企业和医药器械内部流程的熟悉,因此关注点会有不同。在交叉地带会形成竞争,但更多的还是共同合作的状态。”张畅告诉《科创板日报》记者。

有着行业数据和AI大模型训练能力的医疗科技企业,借助DeepSeek这一波行业变革浪潮,发挥出天然优势,陆续推出垂直领域的AI产品,成为有别于华为等科技企业的另一类竞争梯队。

近期,讯飞医疗科技(02506.HK)与中山医院发布了观心大模型CardioMind(beta 测试版),乐心医疗(300562.SZ)推出心血管病垂直大模型,复星医药(600196.SH)发布了自主研发的PharmAID决策智能体平台,此外,医渡科技(02158.HK)、卫宁健康(300253.SZ)、智云健康(09955.HK)、圣湘生物(688289.SH)等企业通过DeepSeek迅速升级了原有AI大模型。

AI医疗公司鹰瞳科技(02251.HK)发文表示,自研的万语医疗大模型接入DeepSeek-R1模型后,其多模态分析体系可以通过一张眼底照片预知50多种疾病风险。

同时,有医疗科技公司接入DeepSeek生成智能体,解决了行业痛点。在3月15日的第十届健康商品交易大会(西鼎会)上,中康控股(02361.HK)主要业务平台中康科技发布了“医疗健康全场景智能体”,其中的药店智能体能够改变药店的经营困局,帮助实现销售增长。

▌“深度定制”背后

围绕医疗AI大模型,除了应用场景的可行性外,探讨较多的还有投入产出比和商业化问题

赵铎举例中医的辅助诊断,如果想做中医的通用模型,并一步步叠加预问诊、过程中诊断、开方开药等功能,大模型的数据量需求非常大,因为范围不同投入就不一样。反之,想要做某一个小病症的辅助诊断决策产品,注册相对更容易,但从投入和产出来看,大家会缺乏动力。

对于AI大模型应用是否需要注册医疗器械证的问题,业内也存在不同观点。有观点认为,人工智能医疗器械注册,会对数据库的标准更高,要确保准确性、完整度,数据的真实性以及逻辑关系各方面都要更清楚,得出的答案必须是正确的,不能模棱两可,存在幻觉。

张畅则认为,是否需要拿证主要看用途。如果是临床决策支持,例如CDSS(Clinical Decision Support System)也可能有例外。用于诊断决策,按目前的法规有可能需要做医疗器械注册。

关于准确性,他认为存在一个常见的误解是一定要百分百准确。目前的大模型百分之百准确很难,如果可以解释,例如结论在哪些边界里是有效的,就会大大改善局面。设想未来即便要去拿证,也不一定是要求百分之百准确,但可能需要非常多严谨的框定和解释,或者能够基于新的证据提供动态数据反馈。这个模型还可以在一定范围或者时间内,更新自己的判断。

目前已经形成行业共识的是,最终大模型的应用会以智能体(Agent)的形式呈现。刘登湘表示,医院应搭建大模型智能体开发平台,为模型的统一管理和接口标准化做好准备。这一平台不仅便于不同模型的集成与协同工作,还为未来自主拓展更多大模型应用奠定基础。会尽早上线基于大模型的医疗智能体。

智能体构建完成后,就要看医生如何管理AI工具了。在张畅看来,医生管理AI工具其实是从认识、接受、能用,到复用的过程。现在全社会的认知浪潮中,已经具备将AI作为工具的认知,接下来是AI能做什么的知识普及、AI的工作基本原理和能力的边界。

“当有了智能体代理人的时候,AI能够在多大程度上帮你做什么,医生或者使用者还需要添加自己的判断,首先是对协作角色的深刻理解。还有更重要的一点,怎样去进行人机互动,在自发的AI出现之前,要如何进行提问等。对AI有非常好地掌握能力同样是一项重要技能。”张畅表示。

这不算是一场医疗AI大战,更像是步入了共同发展和进步的阶段。只有各方参与,才能补足医疗人工智能的不同发展要素。

伴随着埃隆·马斯克的Grok 3推出,中国AI创业公司Monica的全球首款通用人工智能体Manus的横空出世,AI大模型的故事还在继续。


▌低成本算力需求下,基层医疗成为新落地可能?
 

远在DeepSeek-R1诞生之前,国内已有医院部署通用模型,主动开启了生成式AI的探索之旅。

 

由于临床相关的数据不能脱离院区,当时的大模型只能通过封装入院。这里问题在于:大部分医院拥有的资源环境基本是面向通用计算的CPU,少有医院有面向图形处理和并行计算的GPU资源,很难提供充足算力。

 

算力的困境紧扣成本。众多医院中,佼佼者有能力花大价钱上全套的GPU,将通用模型完整搬入院内,服务全院系统;少部分能对模型进行精简,使其特定的科室受益。

 

当绝大部分医疗机构不能自由配置大模型、开发相关临床应用时,医疗大模型的从业公司也不过好过。缺乏充足的买方,他们很难在大模型方向上进行持续的高额研发投入。

 

DeepSeek-R1的出现打破了这一现状。借助创新架构与开源代码,它从根本上解决了通用模型的部署、运行产生的成本问题。

 

福鑫科创CEO吴笛表示:由于DeepSeek-R1采用的是混合专家架构(MoE),每次推理时仅激活约370亿参数(总参数6710亿),避免了传统稠密模型必须全参数激活的高昂计算成本,理论上能在节省40%以上算力消耗的前提下保持推理的精度。若企业需要扩展模型规模,也无需线性增加算力投入即可补全模型能力。

 

微信图片_20250319195323.png DeepSeek、GPT o1 、GPT o3 mini能力对比


 

更为重要的是,DeepSeek拥有非常友善的MIT license协议,允许用户本地化部署,自由使用、复制、修改和分发软件,也鼓励了企业在产品中采用和集成,鼓励合作和创新,从而推动整个生态系统的发展。

 

这种开放的生态系统使得普通医疗机构能够根据自身的业务需求,开发出更符合实际应用场景的医疗大模型。若只是部署一些蒸馏得到的100B参数量以内的小模型,不少基层医疗手中的集成显卡都能带动模型顺利运行。

 

"在我们同区域型医疗机构的沟通中发现,他们的诉求其实更加明确,希望能将DeepSeek的推理能力用在基层,因为那里最缺能够处理复杂能力的医生。"

 

总的来说,DeepSeek-R1的价值在于降低了大模型应用的门槛,开辟了新的落地市场,同时加速了垂直应用的诞生。这个过程中,这一新兴模型给予了医疗大模型走向商业化的可能。


 ▌医疗机构如何用好DeepSeek?

当计划部署大模型的医院及从事大模型开发的医生个体日趋增多,医疗IT产业中处于上游位置的众多企业也随之活跃了起来。

 

据卫宁健康CTO赵大平介绍,DeepSeek-R1出现后,国内的主流部署模式可简单划分为三种。首先他们可以快速从云端、源端下载模型,快速完成部署,主要适用于已有显卡设备的大型医院。若医院没有运算需要的显卡,他们可以去云端租用设备。同时,也有部分民营医院选择订阅的方式实现部署,主要服务于特定科室。

 

此外,风口之下亦催生了不少制造大模型一体机的企业。但在赵大平看来,医院要想实现大模型的有效运行,首先要将其与医院信息系统本身进行融合,其次信息系统本身要尽量使用支持AI运行的智能架构。

 

毕竟,大模型一体机虽然能够通过外挂的方式实现一部分交互能力,但很难与医院已有的几十套系统进行充分数据交换。除非能够实现“模型+应用”的一体式解决方案,否则很难满足医院多元的需求。

 

那么,理想状态下医院应该如何部署大模型?赵大平认为:伴随大模型的不断深入,未来医院的配置方式一定是多元混合的。“医院可能会配置一个大模型及一些服务细分科室的小模型。大模型用于需要推理、思考、诊断的大型交互场景,小模型用于强调规则、强调判断、矫正以及简单生成的场景,在满足需求的同时实现最经济最高效的应用。”

 

"进一步延伸,医院中存在很多移动化的场景,如果我们能将手机上的小模型建立起来,那么现有医疗流程中的大量工作可以向移动端转移,极大提升医疗效率。"

 

再谈医生及其他试图主动开发临床应用的个体。

 

DeepSeek爆火的同时,各式教程顺势而出,铺天盖地,鼓励用户独立配置、训练模型。但在医疗领域,DeepSeek的出现虽然降低了模型训练的各项门槛,但本地化训练私有模型需要经过数据准备与处理、模型选择与配置、模型训练、模型评估与调优、模型部署与集成五个步骤,仍需要研究人员具备一定的技术功底。

 

“现在的很多大模型的应用开发程度不高,很多医院的研究机构在买了卡配置了模型之后都想立马搭建一个特定场景的应用,但在实际操作时会发现不具备相应的开发能力。要实现医生个体的广泛使用,并以此取得研究成果,我们还需等待服务方对UI进行升级,进一步简化大模型应用的开发路径。”

 

换句话说,企业与医疗机构共同进行垂直模型开发,仍是医疗AI的主旋律。


DeepSeek下,医疗场景应用开启革新?


DeepSeek-R1虽在医疗领域实现了大规模部署,但上线时间较短,在应用场景的开拓方面,它暂未突破大模型已有应用范畴,更加聚焦于部署训练成本的降低与文本处理效率的提升。最初阶段中,着力于互联网医疗的一批大模型企业最先受益。

 

譬如,腾讯健康通过腾讯云接入DeepSeek系列,再结合自研的混元大模型,迅速完成了对智能导诊、预问诊、健康问答、影像报告解读及质控等医疗服务的迭代,并加速帮助全国超过1000家医院快速升级智能应用。

 

目前,腾讯的“深圳医保”应用其智能客服已搭载了最新AI大模型。用户可以自由地选择擅长推理的DeepSeek,或者可以多维度理解问题的腾讯混元,无论是咨询"生育津贴怎么算"这类复杂政策,还是询问"门诊特定病种如何认定"等专业问题,融合后的大模型都能结合具体参保情况,给出精准到位且具备“Think”的解答,在回复用户的同时帮助用户理解问题。

 

当DeepSeek积累的医疗数据日益增多,它在医院场景中的应用优势也开始逐步显露。得益于在提示词方面的要求显著降低与思维链技术赋能,DeepSeek有效提升了AI在临床诊断中的透明度与可解释性,并能帮助医生更为高效地与模型沟通。

 

举个例子,医生过去使用大模型生成手术方案,需要完整清晰地写明过往病史、手术情况等信息,而使用DeepSeek时只用输入一些关键信息,模型会在“Think”的过程中自主填补相关信息。

 

此外,医疗推理讲究循证过程,DeepSeek不仅能够提供有效的诊疗建议,更能详细阐明其背后的推理过程,包括诊断依据、用药选择和检查项目等。这种透明化极大化解了医生对AI系统的猜忌,为医患沟通提供了清晰的依据,进而促进了AI技术在临床中的更广泛应用。

 

“很多医生都非常关注模型‘think’的过程,他们会大致扫一眼Deepseek的逻辑,这是一种重要的交互,能让医生产生信任。”

 

到目前为止,已有不少医院上线了大模型相关应用。以医疗文书书写为例,福鑫科创、卫宁健康等企业都开发了类似应用。以福鑫科创为例,该公司与武汉协和医院、武汉大学中南医院等医院落地门诊、住院多个场景的AI生成式电子病历系统,尝试提高医生的书写病历效率。

 

传统的医生在门诊看诊场景中,单个患者就诊时长按照10分钟计算,一般用于书写电子病历的时间在5分钟,开药、开检查的时间在3分钟,真正用于问诊的时间也平均只有2分钟。有了AI之后,AI会实时记录医患的对话,并将其转化为医学术语,按照门诊电子病历模板自动书写电子病历,省下电子病历的书写时间。

 

“按照一个医生每天看诊50个病人计算,每天可以至少节省1个多小时的书写病历时间,若医院将节省的时间用于看诊更多的患者,那大模型可以为医院创造实实在在的经济价值。”因而在吴笛看来,这是目前价值最高,相对容易落地的场景。

 

由于DeepSeek模型本身没有投喂过CT、MR相关影像数据,企业开发相关应用时需要自行建立影像数据集并构建模型。因而相较于各类文本工具,医学影像领域展开基于DeepSeek大模型研究相对较少。

 

目前,深智透医在内部工具层面对DeepSeek进行了部分探索。譬如,他们将DeepSeek用于影像数据多模态标准化和增强,利用图像数据+meta data非图像数据(EMR、HIS\RIS、DICOM header等有大量语言信息)提高成像内容及命名的一致性,优化下游应用(例如hanging protocol等更准确一致可以提高医生效率)。

 

而在质控数据分析方面,深智透医则在尝试借助大模型提升医学影像质量控制、异常识别能力、工作流问题交互能力。

 

需要注意的是,虽然基于DeepSeek进行的影像学研究颇为有限,但行业对于影像大模型已实现大量研究成果。部分企业基于GPT等模型建立起了影像基座模型,并在临床试验中证实了LLM对于医学影像诊断的准确率、效率提升。伴随DeepSeek能力的进一步增强,这些企业亦有可能慢慢转至国产通用模型。

 

再谈医院场景之外的药物研发,这里同样是各类大模型的重要竞技场。

 

目前,深智透医已在尝试使用DeepSeek处理医学影像标准化问题,进而在医药研发试验中更好地解决影像数据质控等问题。据深智透医CEO宫恩浩透露,该企业已签约一批国际药厂,优化他们已有研发中的影像试验数据。

 

还有一些模型虽然没用DeepSeek,但也采用了类似的创新技术。

 

例如,百图生科的xTrimo系列大模型同样采用了Moe框架,其V3版本可处理DNA、RNA、蛋白质、细胞、化合物-蛋白互作、蛋白-蛋白互作及生命系统等七大模态数据,可实现从碱基对到细胞集群的全尺度建模,进而赋能抗体和细胞基因疗法药物领域、靶点发现方面、微生物等领域的科学研究。

 

不过也需注意,无论是医疗机构相关的赋能,还是药物研发的前沿探索,开发者们使用DeepSeek等大模型几乎都是在原有场景中进行升级,尚未能开发出颠覆已有场景的应用,谈不上革新。好在DeepSeek- R1的上线仅有不足两个月的时间,伴随时间的推移,我们很有可能目睹来自医疗AI的惊喜。


虽说DeepSeek-R1的出现极大程度推进了医疗领域对于大模型的应用深度,但理性来讲,要在医院日常之中用上大模型,仍然需要等待不少时日。

 

首先,解决复杂问题需要大模型像医生一样结合患者的各模态数据,进行综合推断。但在“Think”过程中,DeepSeek时常会陷入一种可能无限循环的情况,导致出现大量无关于问题本身的答案。对医疗这样严肃、高频的领域,必须消除这些场景幻觉才能有望规模化落地。

 

其二,DeepSeek拥有的“国产”身份证明使其更受国内医疗机构的青睐,但要规模应用,仍需符合医学数据隐私与安全合规。因而需要DeepSeek出台更完善的数据脱敏、加密技术,确保患者数据安全。

 

其三,DeepSeek解决的是过往大模型欠缺的产品质量和性能问题,未能找到“杀手级应用”推动医疗机构主动付费。就目前来看,AI的付费逻辑还是和用户认知及产品本身方向是否能真实降本增效创收赋能有关。因此,DeepSeek要想规模落地,一是提升医院与医生的接受度,二是要在传统AI的基础上进一步提升。至于谁付费这一问题,从AI近十年的发展看,基层医疗比等级医院更为需要大模型的支持。

 

第四,DeepSeek的技术突破并非不可复制。如今,GPT的部分版本已将模型训练成本大幅压缩,逼近DeepSeek水平,且在逻辑推理能力方面不断提升。这需要DeepSeek进一步巩固优势,在实际临床问题方面做出成果。

 

尽管挑战重重,我们依然能够从中看到很多积极的东西。毕竟,大量医疗企业与医疗机构的加入必将生成更多的垂直应用,拓宽大模型商业化的可能。

 

同时,DeepSeek等模型自身的潜力也不容忽视。按照现有大模型的迭代速度,每三个月通用模型都将完成一波全面迭代。或许在2025年之中,我们便能目睹某一大模型脱颖而出,逐一攻克上述问题,与众多医疗科技企业一同开启医疗大模型的新图景。


特别声明:智慧医疗网转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。

凡来源注明智慧医疗网的内容为智慧医疗网原创,转载需获授权。

智慧医疗网 © 2022 版权所有   ICP备案号:沪ICP备17004559号-5