欢迎访问智慧医疗网 | 网站首页
 
当前位置:首页 > 医疗信息化

一文读懂:部署DeepSeek时,医院如何“花小钱办大事”?

发布时间:2025-04-02 来源:CDSreport 浏览量: 字号:【加大】【减小】 手机上观看

打开手机扫描二维码
即可在手机端查看

自2025年春节以来,DeepSeek已经在超过100家医院落地,大模型技术在提升医疗质量和效率方面发挥了关键作用。然而,目前大多数医院对大模型仍存在疑惑,对其不同算力版本、智能体应用、硬件支持等缺乏足够的了解。为此,CDSreport围绕医疗场景下的大模型部署、应用等话题,开展系列分析报道。此前已经探讨过不同版本DeepSeek与应用场景等话题,本期CDSreport将围绕大模型本地化部署的硬件部署等问题进行深入剖析。

结合模型参数:
高参数决定高算力需求
CDS REPORT  |PART 1


7B、14B、32B、671B这些数字代表了大型语言模型(LLM)中参数的数量,也可以被认为是模型在训练过程中学习到的“权重”,它们存储了模型对语言、知识和模式的理解。一般来说,模型参数越多,模型就越复杂,理论上可以学习和存储更丰富的信息,从而捕捉更复杂的语言模式,在理解和生成文本方面表现更强大。

例如,671B甚至更大参数的模型能够处理更复杂的任务,生成更连贯、更细致入微的文本,在知识问答、创意写作方面表现更出色。其强大的能力能够支持疑难病症的诊断、多学科协作诊疗、多模态数据处理,甚至大型科研项目或超大规模的技术研究等场景。7B、14B等参数量较小的模型尽管在推理能力上稍差,但其资源消耗更少,运行速度更快,更适合问诊、病历分析、治疗方案推荐等特定场景的应用。

参数的大小不同也意味着模型需要不同的计算资源(GPU算力)、内存(显存VRAM和系统内存RAM)以及数据来进行训练和运行。一般来说,参数规模越大,对硬件的计算能力、内存、存储等要求越高。以DeepSeek为例,其1.5B蒸馏版模型使用一台8GB显存、16GB内存的个人电脑即可使用,而70B则需要160+GB显存、128+GB的工作站。

微信图片_20250402154106.jpg
 DeepSeek系列模型硬件需求对比。来源:CSDN

不同参数的模型需要对应部署相应算力才能满足日常诊疗工作需要,真正用于提升诊疗质量和效率。如果医院已经部署相应服务器,则需要根据算力配置选择能够支持的模型参数,进而完成训练、微调和应用等工作。

结合应用场景:
不同部署策略体现智慧化建设布局
CDS REPORT  |PART 2

根据各家医院已经公布的完成DeepSeek本地化部署和应用的信息,目前大模型在医院中的应用大多围绕决策支持、病历生成、知识检索等。不同场景的应用决定了计算量和同时使用人数的不同,这也是医院部署硬件时需要着重考虑的重要参考指标。

例如,在分析患者病情时,大模型需要调用患者病历信息,并根据训练和优化过程调用数据库相关医学知识,同时思考分析步骤并推理分析结果。该过程的结果更加依靠训练数据和知识库,对于模型推理能力和计算量需求不算太高,应用14B或32B即可满足推理需要。如果是面向患者的分诊、预问诊等功能,可能存在同时使用人数较多的情况,则需要硬件设备具备高“并发路数”的能力。

CDSreport发现,目前医院部署算力硬件设施的策略各不相同。有的医院部署了32B、14B等体量相对较小的模型,应用场景聚焦在诊疗工作或管理工作中的某一个单一领域,更关注实用性和性价比;有的医院部署了满血版DeepSeek和高算力硬件设施,尽管初步实现的功能也仅限于某一类场景,但为未来智能体部署和功能拓展保留了空间,具备更高的可拓展性;有的医院采用“大模型+小模型”部署策略,针对算力需要不同部署相适应的硬件设施,具备更好的灵活性和稳定性。

综合来看,医院采用的硬件设施部署策略来源于对应用场景的规划,而不同的侧重点则体现了医院对于智慧医院建设的整体布局。

结合预算成本:用技术实现“花小钱办大事”
CDS REPORT  |PART 3

为满足不同参数模型对于算力的需求,硬件设施的部署也存在较大的差异。例如,7B模型仅使用配置较高的个人电脑即可运行,预算成本仅需1-2w元;而671B的满血版DeepSeek则需要进行服务器集群式建设,成本动辄在7位数。医院常常因此在效果与成本之间纠结,一方面碍于有限的预算成本,另一方面担心小参数模型无法满足使用。

此前,CDSreport分享过模型参数与应用场景的关系,发现模型参数并非“越高越好”,只有最适合应用场景、进行有针对性的优化和微调的模型才能发挥最好的效果,实现“花小钱办大事”。

例如,将大模型应用于病历质量控制工作,不仅需要大模型能够获取并理解病历前后文本,还能准确指出病历中存在的问题。该过程不仅对大模型推理能力有较高的要求,还要能够深入临床场景和质控体系,并建设相应的知识库和规则库,发挥事中质控和多级质控等作用。而利用临床决策支持系统(CDSS),大模型不仅解决了病历信息不完整的问题,保障了病历信息的完整性,还能够通过与医生的交互,在诊疗过程和病历书写过程中辅助医生、质控人员和管理人员及时发现并修正病历缺陷,落实多级质控体系。

在模型的优化方面,如何用更低参数的模型实现更高的推理效果是各家医院和医疗AI厂商共同追求的目标,越来越多的成功案例正逐步显现效果。以惠每医疗大模型Copilot为例,经过研发团队在DeepSeek-R1 32B模型上的训练和优化,其病历质控智能体的准确性已经达到了满血版DeepSeek的水平,但部署成本仅为1/5,为医院的大模型本地化部署提供了更多选择。


特别声明:智慧医疗网转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。

凡来源注明智慧医疗网的内容为智慧医疗网原创,转载需获授权。


智慧医疗网 © 2022 版权所有   ICP备案号:沪ICP备17004559号-5