欢迎访问智慧医疗网 | 网站首页
 

医院大数据中心建设六个常见问题

发布时间:2025-06-29 来源:十堰人医运管园地 浏览量: 字号:【加大】【减小】 手机上观看

打开手机扫描二维码
即可在手机端查看

随着大数据在医疗行业临床诊疗、医院管理、健康管理等领域应用热度增加,越来越多医院设立了大数据中心或者在信息中心基础上开展了大数据的建设。医院在建大数据中心或平台时,首先要做好定位。大数据中心的定位不同,其职责也不同。

为什么要建大数据中心?

从整体上看,当前医院信息化建设活动可以划分为三大块,分别是业务信息系统建设、集成、数据分析利用。在这三大板块里,数据中心位于一个非常基础的地位,每一个板块都与它有很深的关联。

早期,信息中心主要的职责是建系统;后来逐渐发展为“建设”与“运维”并重,以保证系统可靠、稳定的运行;现在,信息中心不只负责建系统管硬件,如何提供真正的信息服务,变成一个越来越重要的问题。实际上,这个需求是客观存在的,以解放军总医院计算机室为例,每天都有科室来申请查数据,以做统计分析。虽然解放军总医院计算机室安排了专人对接查询数据,逐渐变得有程序,但总体来讲,还是自发、散在的服务。相信大多数医院的信息科普遍面临同样的问题。

医院信息中心需要借助大数据的理念,向数据服务方面转型,把自发的、散在的、无序的利用变成有组织的、有顶层设计的服务。在这样的背景下,解放军总医院成立了大数据中心。对于信息中心来讲,辅助各科室查询数据从“友情出演”变成了“领衔主演”。


定位不同职责不同

医院大数据中心不局限于某个分析主题,利用大数据技术,覆盖数据标准、数据采集、数据校验、数据分类、存储治理及分析应用全方位内容。不牵涉业务流程,将数据从入口、出口、准确性、权限、安全等方面全面管理起来,构建统一的数据秩序,以“统一数据”为出发点,形成统一的数据资源库,提供给不同应用灵活使用。

大数据中心有三种定位:管理、处理和分析。

第一,数据资源管理,即把大数据整合管理起来提供数据资源服务,科室需要的数据经过审批和授权后,由大数据中心提供,这是基本职能; 

第二个,数据的处理和加工服务,根据临床问题研究需要对原始数据进行处理,从中抽取一些特征,然后提供给临床; 

第三个,数据的分析服务,即按照科室的需求做数据的分析,比如病例分布、基于数据建立模型进行疾病和不良事件预测等。 

大数据中心的定位不同,其职责也不同。

如果大数据中心定位为大数据管理职能,有三个职责:第一,整合各个业务系统数据;第二,形成长期的管理机制,即对历史的、现在的数据资源进行一体化的管理;第三,根据临床访问需求,进行访问授权。这一定位的工作平台为数据整合平台(ETL)、数据检索系统、数据浏览系统和数据在线使用(虚拟桌面),所需人才为IT工程师。 

如果大数据中心定位为加工中心,其职责主要是根据用户需求,从原始数据加工生成特征数据。这一定位的工作平台包含以下几方面:第一,增加自然语言处理工具;第二,建立专病数据库的平台,帮助一线的医护人员或科研人员整理数据;第三,建立组学数据等专业化技术平台支撑特定数据的处理。该定位所需人才还是IT工程师 。 

如果大数据中心定位为分析服务中心,其职责是为用户提供数据分析服务,所需平台除了数据检索、加工分析外,还包括以下几个方面:第一,各种类型的建模工具;第二,可视化平台,通过图表把数据分析结果更直观的展示出来;第三,需建立大数据深度学习平台。这时所需人才除了传统的IT工程师,还需要专门的数据分析工程师。 


“大数据中心”有不同的内涵,不同的职能定位对应不同的技术平台与人才团队建设内容。在提出建设大数据中心规划时,首先要明确大数据中心的职能定位。


医院大数据中心建设六个常见问题

问题一:医院已建立了CDR还需再建设大数据中心吗?

在不同场景下,“医院数据中心”的含义也并不相同,通常有两类数据中心:第一类是以业务支撑为主、面向电子病历的数据中心,也即CDR,其作用是支撑日常的医疗活动,进行医疗过程中的数据收集与呈现,同时兼顾常规报表统计等功能。第二类是以管理和科研利用为主的数据分析中心,也即大数据中心,其作用是面向临床研究、医院管理与智能产品开发,满足数据批量处理的挖掘与分析需求。

从技术手段来看,大数据中心一般需引入ETL等方式,在数据组织方面以群体数据为中心,通常对实时性要求不高。在医院已经建有CDR的基础上,为开展大数据分析工作,仍需建立大数据分析中心。原因有三。

首先,二者收集与使用的数据内容有异。

其次,二者工作模式不同。

第三,二者技术形态也不一样。


问题二:医院数据能否一次性治理到位?

数据治理通常有两种路径。第一种路径是将不同来源的异构数据进行整合,建立数据库;再对文本数据进行解析,将数据结构化;最后对于非标准术语进行归一处理,形成清洗后的数据,后续可以以其为基础进行数据分析。第二种路径是整合原始数据形成原始数据资源池,待研究问题产生以后,再针对特定问题选取相关数据进行结构化和归一化处理。

薛万国表示,数据治理是贯穿数据分析整个过程的,没有办法一次性完成。他建议:在数据整合阶段,以数据结构转换为主,尽量保持数据的原始性,但为了便于数据检索,可以在整合完成后进行数据特征抽取;数据加工与深度治理,则放在面向特定目标和问题的研究阶段再进行处理。


问题三:专病数据库是不是数据研究的必由之路?

目前医院常见的专病数据库分为两种:一种是基础病例库,一般要求特征数越全越好,数据整理的工作量很大;一种是面向问题的病例库,也即针对特定科研课题的数据收集,对数据质量要求较高,其优点是数据质量高、后期的数据处理量小,缺点是工作量巨大。这是大部分专病数据库效果不佳的主要原因。

薛万国认为,当医院建有大数据中心和相应的服务能力以后,可以将病例原始数据整合在数据资源池内,临床科研人员针对具体的研究问题,利用大数据中心提供的服务进行数据加工、特征抽取和数据分析。这种方式的优点是前期的工作量小、难度低,适合缺乏长期专门团队的临床科室,缺点是数据质量不及专病数据库。这种方式的好处在回顾性科研课题中表现较为明显。


问题四:是否存在一体化的大数据平台?

大数据的利用通常分为四个阶段:数据整合、数据处理、数据建模分析及数据可视化,在每个阶段需要用到的工具都有所不同。

不同阶段所用工具五花八门,各有特点,也都有各自优秀的厂家和产品。医院的大数据平台实质是一组工具集,不同用户的使用偏好也各不相同,没有必要将所有人都束缚在单一平台上。


薛万国认为:“一体化大数据平台很难适用,即便存在,效率也未必会高。”


问题五:在大数据中心建设过程中,是否一定要用到Hadoop?

医疗大数据往往是“大”和“小”并存,“大”是指医院内的全量数据很大。但在研究具体临床问题时,所涉及的数据量又是很“小”的,往往是几万例、几千例,甚至是几百例病例。

薛万国认为,在处理医疗大数据时,混合技术更为适宜。传统技术,特别是关系数据库技术,其数据加工、管理、分析功能都非常成熟,生态环境也非常好,适用于大部分数据处理场景。在追求检索速度时,则可能需要用到Hadoop或其他分布式并行处理技术。“如果把所有的工作都放在Hadoop上来做,无异于自缚手脚。”

薛万国认为,Hadoop在医疗行业也面临很大的局限性:技术体系较为复杂,生态圈较小,常用工具的匹配性相对较差,不太适于数据录入和数据加工。所以,医院的大数据中心建设不一定要采用Hadoop。


问题六:是否需要在信息中心部门之外设立大数据中心部门?

大数据中心和信息中心的职能与特点不同:传统信息中心通常以信息系统建设和运维为主要职能,大数据中心的职能是提供数据服务,尤其是为临床医学研究提供服务,这些服务是个性化的,需要特定技能的团队来提供。

同时,大数据中心和信息中心的关系又非常紧密,大数据中心的建设紧密依赖于医院的信息化建设,所有的数据都来源于信息系统,二者密不可分。在数据质量方面,也需要通过信息化建设来不断地提升数据质量。

薛万国认为理想状态是:信息中心提供原始数据,大数据中心分析数据、建立模型,所得成果再通过医院信息系统赋能临床。

薛万国表示:“大数据中心和信息中心并非简单的分与合的问题,应该在医院内建立一个大信息体制,这个体制要体现出大数据中心是传统医院信息化内涵的扩展。至于大数据中心是否需要独立设置,这只是行政管理、分工管理上的形式问题。”


如何建好、用好大数据中心?

解放军总医院成立大数据中心之后,明确了其定位——为各科室提供服务。那么如何利用大数据提供的契机为医院医疗的创新发展、科研的创新发展、管理的创新发展提供服务?必须要有服务的地方、服务的平台、服务的人员,一个运作的实体才能开展有组织的服务。

第一,需要一个公共顶层设计的基础平台。这个基础平台包括软、硬件平台、人工服务,可以提供各种各样的支持。此外,大数据需要一系列的技术支撑,才能在原始的业务数据上去做大量的分析。

第二,需要有技术的服务人员。很多医院的信息中心,现在不缺IT的人,缺数据分析的人才。我们的平台应该提供这样的服务:科室有数据的利用需求,有思路,我们除了提供技术上的支持,还有专人来给予支持配合。

第三,大数据真正的落脚点在应用上。解放军总医院的做法是一方面跟科室调研,另一方面,征集科室的项目。解放军总医院用设课题的办法,给科室资助,科室来申报,进而调动起各科室的积极性。靠项目的需求来牵引,靠我们提供的数据服务,把各科室的积极性吸引到平台上来。所以,解放军总医院的做法是建平台,同时抓应用。  

作者:薛万国  解放军总医院大数据中心主任

特别声明:智慧医疗网转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。

凡来源注明智慧医疗网的内容为智慧医疗网原创,转载需获授权。


智慧医疗网 © 2022 版权所有   ICP备案号:沪ICP备17004559号-5