欢迎访问智慧医疗网 | 网站首页
 
当前位置:首页 > 资讯 > 观点

深度解读 | 刘烈宏《深化市场化配置改革 释放数据要素价值》,医疗数据正走向"源头活水"

发布时间:2026-06-26 来源:医数流通 浏览量: 字号:【加大】【减小】 手机上观看

打开手机扫描二维码
即可在手机端查看

2026年6月23日,国家数据局局长刘烈宏在《人民日报》发表署名文章《深化市场化配置改革 释放数据要素价值》。文章首次以"531工作体系"为框架,系统阐述了数据要素市场化配置改革的完整逻辑——为什么改、改什么、怎么改。对于医疗健康领域而言,这篇文章的意义不在于"又一次重申数据的重要性",而在于它标志着国家数据要素改革从"探路期"正式进入"施工期",而医疗数据因其"高价值、高敏感"的双重属性,正处于这场改革最受关注的交叉点上。

本文尝试做一件事:以刘烈宏原文为骨架,逐一解析其核心判断在医疗数据领域的含义、检验其适用边界、追问落地的可行路径。

一、这篇文章为什么在这个时间点发布:四个维度的解读

解读一篇文章,首先要回答的问题是:它为什么是现在。

第一,时间维度——"价值释放年"从概念走向落地

2026年初被全国数据工作会议定义为"数据要素价值释放年"。但上半年国家数据局的主要工作是调研和摸底:5月下旬至6月初,刘烈宏密集走访温州、深圳、东莞、北京四地,调研对象覆盖数据交易所、数据集团、医疗机构、数据标注基地。6月23日——调研结束后不到三周——即在《人民日报》理论版发表署名文章。这个节奏说明,文章不是例行的工作体会,而是调研完成之后形成的行动纲领。

"探索形成了"这五个字值得注意——"探索"意味着过去两年在试,"形成"意味着现在已定型。这篇文章是"531体系"从内部工作框架走向公开行动纲领的转折标志。

第二,制度维度——顶层设计已经完成,细则进入密集出台窗口期

文章开篇即引用党的二十届四中全会"加快完善要素市场化配置体制机制"的部署。四中全会于2025年10月召开,距今8个月。文章在这个时点发布,释放的信号是:政治层面的方向已经明确,接下来是各部门、各地方出细则的阶段。文章反复出现的"制度引领""破除体制机制障碍""健全数据基础制度"三个表述,指向同一件事:数据产权、数据交易规则、数据安全合规标准等此前各方呼吁已久的基础制度,已进入最后征求意见阶段。对医疗领域而言,北京在2026年4月率先发布《健康医疗数据匿名化技术规范(试行)》,不是孤立的地方探索,而是对国家层面制度即将出台的提前响应。

第三,产业维度——从"吹风"到"发令",推动数据产业从零散试点走向规模化

"5"大组合拳中的"数据融合应用和场景建设""全国一体化数据市场建设""数据产业培育"三者存在递进关系:场景是牵引、市场是载体、产业是结果。文章明确判断"依托数据交易所等开展供需匹配也在加快发展,但规模和占比相对较低"——这句话的语气不是批评,而是点出下一阶段的工作重心:交易所要从边缘走向主流,场外交易要逐步纳入场内合规轨道。文章随后提出"一体推进制度、生态、设施、治理等建设,加快建设开放共享安全的全国一体化数据市场"——"全国一体化"意味着此前各地数据交易所"各自试点、规则各异"的局面将被统一规则和跨交易所互联互通的技术标准所取代。

第四,医疗数据已被纳入改革的优先序列

6月2日,刘烈宏在北京调研了四个机构:首都医科大学附属北京友谊医院(数据源头)、北京国际大数据交易所(流通平台)、北京数据集团(公共数据运营主体)、医渡科技(产业应用端)。四个点的组合不是随机的,它构成了一条完整的"医疗数据产业链"从头到尾的考察线。调研三周后的署名文章中,至少有五个关键表述直接回应了这次调研中观察到的问题:

调研结束三周后发布的文章中,至少有五个关键表述直接回应了此次调研中观察到的问题:"不可能三角""高敏感数据安全可信流通""场景牵引""数据标准化""数据是人工智能的燃料"。尤其值得关注的是,在核心技术攻关部分,文章专门提出"破除制约大规模高价值、高敏感数据安全可信流通的梗阻"——在所有行业中,同时满足"大规模""高价值""高敏感"三个条件的,医疗数据几乎是最典型的样本。这不是泛泛而谈,而是调研之后形成的定向判断。

综合以上四个维度,一个合理的推断是:医疗数据已被国家数据局列入数据要素市场化配置改革的优先领域,下一步大概率会有针对医疗数据的专项政策或试点方案出台。

二、三重"重要意义"在医疗领域的对应与落差

刘烈宏原文从三个"这是"出发论证改革的意义。将这三个判断置于医疗数据的语境中检验,会发现一个耐人寻味的落差:原文的诊断完全适用于医疗领域,但医疗领域的现实距离原文描绘的目标恰好最远。

第一个"这是":促进高质量发展的现实需要

原文:充分发挥数据要素协同优化、复用增效、融合创新的作用,不仅可以优化传统要素资源配置效率,还可以突破传统资源要素约束条件下的产出极限。

这段话在医疗领域有一个精确的对应面。医疗行业是"传统资源要素约束"最典型的行业之一——一名合格的外科医生培养周期超过十年,三甲医院专家供给存在刚性的时间和人力天花板。如果医疗数据能够实现跨机构的融合与复用,一个罕见病病例可以在全国范围内被快速检索和比对,一个基层医生的诊断判断可以得到三甲级诊疗经验的数据"加持"——这就是原文所说的"突破传统资源要素约束条件下的产出极限"在医疗领域的确切含义。

但现实是另一番景象:一份住院病历在患者出院之后,除了医保结算和偶尔的科研检索,几乎不再被二次使用。患者跨院就诊,因为上一家医院的电子病历无法被下一家医院调取,重复检查、重复问诊成为常态。根据公开研究,中国三级医院间检查检验结果的互认率长期偏低,其中影像数据的互认率在部分地区经过专项推动后有所改善,但检验数据和病历文本数据的跨院流通仍然缺乏制度性通道。

医疗数据不仅没有发挥"协同优化、复用增效、融合创新"的作用,反而因为不能复用,增加了整个系统的资源浪费。原文提出的"优化传统要素资源配置效率",在医疗领域的反向诠释是:因为数据不流通,医生劳动力被大量消耗在重复问诊和重复检查上,这恰恰是资源配置的低效。

第二个"这是":培育发展新质生产力的内在要求

原文:推动数据要素与土地、劳动力、资本和技术等传统生产要素结合,能够助推生产要素创新性配置,提升全要素生产率。

医疗行业的新质生产力指向什么?指向AI辅助诊断系统在基层医院的使用、指向大模型驱动的药物分子发现、指向基于真实世界证据的临床决策支持。这三者的共同"燃料"是高质量、大规模、多中心的医疗数据。

但一个常被忽略的事实是:目前中国获批的AI医疗器械三类证产品(截至2025年底已超过60款),其训练数据几乎全部来自单一医疗机构或单一地区。单中心数据训练出的模型,在另一家医院的不同品牌CT或MRI设备上,准确率可能出现显著波动。根本原因在于不同设备的成像参数、重建算法和灰度分布存在系统性差异,导致训练数据与推理数据的分布偏移。联邦学习——让模型在多个医院的数据上联合训练而原始数据不出院——在技术上已被验证可行(微众银行的FATE框架、百度的PaddleFL、英伟达的Clara Federated Learning均在医疗场景有验证案例),但因为多中心数据协作缺乏标准化的法律协议模板和合规审查流程,至今无法从实验环境走向规模化部署。

原文说"助推生产要素创新性配置"——在医疗领域,数据要素与传统要素(医生劳动、医疗设备资本)的结合点正好被卡住了。不是数据不存在,而是数据出不来。

第三个"这是":抢抓全球科技革命和产业变革战略机遇的必然选择

原文:数据要素的乘数效应在知识发现、技术突破和成果转化中加速释放,是新一轮科技革命和产业变革的"燃料"和"催化剂"。

用一组数据可以衡量中国在这一轮竞争中的位置。全球真实世界数据与真实世界证据市场2024年规模约为34亿美元,预计至2030年将超过100亿美元。美国FDA已建立完整的真实世界证据框架,自2018年发布《真实世界证据方案框架》以来,已利用真实世界数据支持多项药物的适应证扩展和上市后安全性监测。FDA Sentinel Initiative系统整合了数亿患者的电子健康记录和医保索赔数据,能够主动监测药品不良事件信号。

中国拥有全球最大的患者人群基数,三级医院年诊疗人次超过30亿,每年产生的电子病历数据量以EB计。但在真实世界证据的产业化和监管应用上,中国仍处于起步阶段。国家药监局药品审评中心于2024年发布了《真实世界证据支持药物研发与审评的指导原则(试行)》,但截至目前,完全基于中国人群真实世界数据获批上市或扩展适应证的药物数量极为有限。

数据量的优势没有自动转化为数据产品的能力。把原始数据变成证据,中间缺的不是一两个环节,而是一整套制度基础设施。原文所说的"抢抓战略机遇",在医疗领域的翻译是:如果我们不能在未来三到五年内建立起医疗数据从采集、治理、流通到应用的完整制度链条,全球最大患者人群的"数据富矿"将只是沉睡的矿石,而非提炼出的燃料。

三、三个"特性规律"在医疗领域的检验——兼论一个需要修正的判断

原文第二部分围绕三个核心关系展开:市场化和价值化的关系、流通交易多元形态、数据价值释放规律。这三个判断对医疗数据具有根本性的指导价值,但其中有一个判断需要在医疗语境下做出重要修正。

(一)"市场化是手段,价值化是目的"——全文的核心判断

原文:数据要素只有在使用过程中才会创造价值、体现价值,数据只有用得好,价值才能"显性化"。市场机制是助推和放大数据要素价值的重要路径,市场化是手段,价值化是目的。

这是全文最重要的一句话。它纠正了一个在当前讨论中相当普遍的认知偏差:把"数据值多少钱"当成核心命题,试图给一座医院的病案库做一个资产评估。原文明确指出——数据不用起来就没有价值。价值体现在使用中,不在资产报表上。

这个判断对医疗数据具有根本性的指导意义。医疗数据价值化的真正命题不是"一亿份电子病历能卖多少钱",而是:这些数据能不能在脱敏后支撑一个药品安全性信号的主动监测模型、能不能训练出一个可以推广到县级医院的AI辅助诊断系统、能不能基于中国人群的临床真实世界数据加速一个新药的适应证扩展。

具体而言,医疗数据价值化有三个可验证的维度:

第一,临床维度——多中心数据融合辅助罕见病诊断,一个基层医生遇到疑难病例时,系统能在脱敏的全国类似病例库中进行相似性检索,降低误诊漏诊率。

第二,科研维度——高质量的真实世界数据支持药品上市后安全性监测和药物流行病学研究,降低对进口数据的依赖。

第三,公共卫生维度——基于多源医疗数据的传染病多点触发预警,以及DRG/DIP支付标准基于真实诊疗数据的动态调整。

原文:让"沉睡"的数据流动起来,成为促进千行百业高质量发展的"源头活水"。

在所有行业中,医疗数据可能是"沉睡"最深的一类。金融数据已经在征信、风控、精准营销中大规模流通;交通数据已经在实时导航、拥堵预测中动态流转;但一份住院病历在患者出院归档之后,被二次使用的概率极低。这不是因为它们没有使用价值——恰恰相反,正是因为它们的价值太高、敏感度太高,所以被锁得最紧。

(二)"点对点交易仍是主流"——这个判断在医疗领域意味着什么

原文:当前,经营主体之间直接的数据交换交易模式是主流。其中,供需双方直接交易占数据交易的绝大部分……依托数据交易所等开展供需匹配也在加快发展,但规模和占比相对较低。

这段话放在医疗数据领域,有特殊的警示意义。

医疗数据领域的"点对点交易",大多数时候包装成另一种形态——药企与医院签订"科研合作协议",企业提供经费,医院提供脱敏数据,双方以"合作研究"的名义完成数据交换。这种模式本身并非违法,但存在三个结构性风险:

第一个风险:患者知情同意的普遍性缺失。大部分医院的入院知情同意书中没有明确涵盖"数据可能被脱敏后用于与企业合作的科研"这一用途。即便最终输出的是群体层面的统计结论而非个体信息,数据从医院进入企业控制范围的这一步骤,在《个人信息保护法》第13条(同意)和第27条(处理已公开个人信息)之间存在着一个灰色地带。

第二个风险:脱敏标准的逐案议定。每个药企-医院合作项目自行约定脱敏方案——有的去除姓名和身份证号即视为脱敏,有的进一步去除住院号和医保号。但医疗数据因其高维属性,存在不可忽视的"重识别"风险:2006年哈佛大学Latanya Sweeney的研究表明,仅凭邮政编码、出生日期和性别三个字段,即可重识别87%的美国人口。在缺乏统一脱敏技术标准的情况下,逐案议定的脱敏方案不足以形成有效的安全保障。

第三个风险:一旦出现数据泄露,追责链条断裂。数据从医院到了药企,药企的合作方可能再共享给第三方——原始数据供方(医院)与最终数据使用方之间的法律追责链路不清晰。

2026年4月,北京市卫健委举办健康医疗高质量数据集宣介会,促成北京同仁医院与拜耳医药、恒瑞医药达成数据交易合作意向。这个案例的正向意义在于——它把原本可能私下进行的"点对点交易"放到了一个公开的、有规范化合规框架的平台上。交易本身可能仍是供需双方直接对接,但合规条件(匿名化标准、使用范围限制、患者知情同意模板)是公开和统一的。这是"场外交易场内化"的过渡形态,值得在更大范围内推广。

(三)"企业内部自用→协同优化→流通交易"——这个递进路径在医疗领域为何断裂

原文:企业数据则以"内部自用—协同优化—流通交易"递进式释放价值,在用好企业自有数据基础上,深度赋能产业链上下游和生态建设。

这是全文最需要在医疗现实中进行修正的一处判断。

企业数据之所以能实现"递进式释放",根本原因在于企业在法律上是其经营数据的统一权利主体,可以在不同阶段做出不同的授权范围和合规决策——先用在自己内部,再开放给产业链合作伙伴,最后将部分数据产品化并在交易所挂牌。每一步的授权扩展,都由同一主体在同一管控框架下完成。

医疗机构的数据不符合这个假设。

一份电子病历从"内部自用"到"协同优化"这一步,面临的法律合规成本不是渐进增加的,而是断崖式跃升的。在医院内部使用病历数据(诊疗目的),受到《执业医师法》和原卫生部《医疗机构病历管理规定》的规范,合规框架清晰明确——医生有权在诊疗需要时查阅病历,几乎不产生额外合规成本。但一旦要把数据共享给院外的协作方——哪怕是为了多中心临床研究、哪怕是脱敏后——立刻触发《个人信息保护法》《数据安全法》《人类遗传资源管理条例》《涉及人的生物医学研究伦理审查办法》等多部法律法规的交叉管辖。知情同意的范围要不要重新取得?伦理审查从哪里走?人类遗传资源管理办公室的审批要不要报?脱敏到什么程度属于"不再具备识别能力"从而豁免《个人信息保护法》?每一个问题都没有标准答案。

这不是医院"不愿意共享数据",而是合规成本结构使然。在一个医院的内部决策中,共享数据的收益可能是模糊的、长远的(一篇论文、一个合作项目、一笔不确定的收益分成),但不共享的收益是明确的——零合规风险。在这种不对称的激励结构下,"不动"是理性选择。

这个分析指向一个重要的政策结论:原文的"递进式释放"框架不能直接套用到医疗数据上。医疗数据需要的不是"自用→协作→交易"的平滑升级,而是在"自用"和"协作"之间架设一道制度性的"合规桥梁"——通过标准化的脱敏规范、责任豁免条款和知情同意模板,将断崖式的合规成本降低到可管理的水平。这个问题如果不能在制度层面被解决,医疗数据的"沉睡"将继续下去,无论"531体系"的其他部分推进多快。

四、"531体系"在医疗领域:逐条检视

(一)"5"大组合拳的医疗映射

第一拳:数据基础制度。

原文:坚持制度引领,进一步破除影响生产力发展的体制机制障碍,健全完善数据基础制度。

医疗数据领域最核心的"体制机制障碍"不是模糊的"制度不完善",而是三个具体的、可以精确描述的问题。

确权障碍:一份电子病历涉及患者(个人信息主体)、医生(诊断智力劳动的创作者)、医院(数据资产的管护者)、医保(支付方和费用数据的提供者)四方主体。在现行法律框架下,没有任何一方被明确授予"决定数据是否可以脱敏后用于特定目的"的完整权利。北京市2026年4月发布的《健康医疗数据匿名化技术规范(试行)》是重要的第一步——它解决了"脱敏到什么程度"的技术标准问题,包括k-匿名化参数设定(k≥5)、差分隐私的隐私预算取值、重识别风险阈值的参考标准。但它回避了一个前置问题:在脱敏之前,谁有权利决定将数据送入脱敏流程?

追责障碍:没有责任豁免条款。一个医院的信息科主任面对数据共享请求时,他考虑的不是"这件事允不允许做",而是"如果出了事,谁承担责任"。在当下的制度环境中,判断"允不允许"永远是最安全的选项——因为"不作为"永远不会被追责。

激励障碍:无收益返还机制。这一点将在下文展开。

第二拳:数据基础设施。

原文:坚持基础先行,加快建设和运营数据基础设施,夯实数据安全基础,破解数据安全合规高效流通"不可能三角"。

"不可能三角"是全文最值得医疗从业者关注的一个概念。在医疗数据中,这个三角表现为:安全(患者隐私不被泄露)—合规(满足多部法律的交叉要求)—高效(数据能及时服务于临床和研究需求),三者似乎无法同时实现。

技术侧的突破方向有三个。联邦学习(Federated Learning):模型参数在加密状态下跨院传输,原始数据不出医院局域网,各参与方本地训练后将梯度上传至中央服务器聚合,在数学上保证原始数据不可从梯度中被逆向推导。可信执行环境(TEE):基于CPU硬件级安全区(Intel SGX、AMD SEV、Arm TrustZone),数据在加密内存中完成计算,宿主机操作系统无法读取明文。多方安全计算(MPC):多个数据持有方在不向彼此泄露各自数据的前提下,通过加密协议联合完成计算任务,仅输出结果不输出原始数据。

实践案例方面,山东健康医疗大数据管理中心牵头的"可信数据空间构建与场景化落地"项目(2026年数据要素"揭榜挂帅"任务)是当前最值得跟踪的医疗数据基础设施实验。其架构设计为:数据持有方(医院)将数据以加密形态存入可信空间的分布式节点;数据使用方(研究者或药企)提交计算请求;计算在可信空间内完成,仅返回分析结果,不返回原始数据。这种"数据可用不可见"的架构,如果能在山东跑通并形成标准化部署方案,将为全国医疗数据基础设施提供可复制的参考模型。

第三拳:数据融合应用与场景建设。

原文:坚持场景牵引,强化数据要素场景应用,打通技术和产业、研发和市场的桥梁,更好发挥乘数效应。

医疗数据最成熟的应用场景不是"卖数据",而是四个方向的数据融合:数据+临床决策支持——基于多中心真实世界数据的临床路径优化;数据+药物研发——真实世界证据支持药品上市后安全性监测和适应证扩展;数据+公共卫生——传染病多点触发预警和慢病管理;数据+医保控费——基于真实诊疗数据的DRG/DIP支付标准动态调整。

每个场景都有技术验证案例和规模化瓶颈。以"数据+药物研发"为例:FDA Sentinel Initiative已运行超过十年,覆盖数亿患者数据,能够在药品上市后持续主动监测安全信号,而非被动等待不良事件报告。中国有类似的技术能力,但缺乏将分散在数百家医院的数据整合为"主动监测网络"的制度安排。瓶颈不是分析算法——药品安全信号检测的数据挖掘方法(如比例报告比、贝叶斯置信区间神经网络)已高度成熟——瓶颈是数据通路。

第四拳:全国一体化数据市场建设。

原文:坚持市场培育,一体推进制度、生态、设施、治理等建设,加快建设开放共享安全的全国一体化数据市场。

在医疗数据领域,"全国一体化市场"面临一个特殊挑战:公立医院的属地管理体制。中国的公立医院由地方卫健委管理,信息系统由地方财政投资建设,数据治理标准由每所医院在采购HIS/EMR系统时自行定义或由厂商默认设置。全国2800多所三级医院的数据治理标准各不相同。

实现"全国一体化"的务实路径,不是建一个全国统一的医疗数据中心——这在技术上可能但治理上不可能——而是建立一套全国统一的医疗数据流通规则体系,包括:统一的脱敏技术标准和重识别风险评估方法;统一的数据产品登记和信息披露规范;统一的跨机构数据协作协议法律模板。在此基础上,各地的数据交易所和可信数据空间实现互联互通,数据产品可以实现"一次登记、多地流通"。

第五拳:数据产业培育。

原文:坚持壮大产业,持续繁荣数据产业生态。

医疗数据产业链条的现状可以概括为:上游有数据但无动力,下游有需求但无供给,中游有技术但无规模。

上游(数据生产者:医院、体检中心、可穿戴设备厂商):三甲医院是医疗数据的"富矿",但大部分数据在产生之后被锁在HIS/EMR系统的数据库中,除了满足医保结算和医院等级评审的统计需求外,缺乏主动治理的动力。

中游(数据治理与加工:脱敏服务商、医学自然语言处理公司、医学编码公司):技术和企业都存在,但体量偏小且市场分散。缺乏一批被国家数据局和国家卫健委双重认可的第三方医疗数据治理服务机构——这类机构的核心价值在于充当"合规担保方",以专业能力和牌照背书,让上游医院"敢出数据"、让下游应用方"敢用数据"。

下游(数据应用:药企、AI公司、保险公司、科研机构):"想买但不敢买"是下游的常态——不是没有预算,而是缺乏合规的供给渠道。

产业链的成型需要一个"催化剂":获认可的第三方数据治理服务机构的出现,以及它们与数据交易所共同构建的合规供给体系。

(二)"3"大基础的医疗紧迫性

基础一:核心技术攻关。

原文:加快数据供给、流通、利用、安全等关键技术攻关,突破一批基础性、原创性关键技术,破除制约大规模高价值、高敏感数据安全可信流通的梗阻。

"大规模高价值、高敏感数据"——这个短语几乎是为医疗数据量身定制的。需要攻关的关键技术包括:跨机构联邦学习中的异构数据对齐(不同医院EMR系统的字段映射和语义标准化);中文医学文本的自然语言处理专病模型(中文临床NLP在命名实体识别和关系抽取上的准确率仍落后于英文,尤其是对非结构化病历文本的理解);高维稀疏医疗数据的差分隐私保护(在隐私预算ε的约束下,如何保持临床分析结论的统计有效性——ε越小隐私保护越强但分析精度越低,医疗场景中的最优ε取值因数据维度和分析目标而异,缺乏系统研究);基因组和生物样本数据的安全合规处理(涉及《人类遗传资源管理条例》的特殊合规要求,且基因组数据的不可逆唯一标识属性使得传统的脱敏方法基本失效)。

基础二:数据标准化。

原文:加快推进数据标准化,强化数据领域"通用语言"构建。要坚持急用为先,加快推进国家数据标准体系建设。

医疗数据的"通用语言"困境有其技术上的坚实基础。同一个临床概念在不同医院系统中可能对应:不同版本的ICD编码(ICD-9-CM、ICD-10-CM、ICD-11混合使用)、不同的检验指标命名(LOINC标准在国内的映射覆盖率极低)、不同的药品标识体系(国家医保药品编码、WHO ATC分类码、医院自编码三套并行)。

原文提出的"急用为先"原则为医疗数据标准化提供了一个务实的推进策略:不必试图一次性统一所有医疗数据字段的标准——这在实践中既不可行也不必要。正确的做法是从数据流通需求最迫切的场景反推标准化范围。如果要支持跨院的糖尿病临床研究,就优先统一与糖尿病管理直接相关的核心字段——空腹血糖(单位及检测方法)、糖化血红蛋白(检测方法及正常值范围)、并发症诊断编码、降糖药物编码。这几十个字段的标准化就足以支撑大多数糖尿病队列的跨院数据合并。至于与糖尿病不直接相关的过敏史、手术史等字段,可以纳入后续批次的标准化。这种"按场景分批推进"的路径,比试图制定一部包罗万象的《全国医疗数据标准》更可行。

基础三:数字人才培养。

原文:加快数字人才队伍建设,加快形成与我国数字经济高质量发展相适应的数字人才供给能力。

医疗数据领域最稀缺的人才,不是单纯的数据工程师,也不是单纯的临床医生,而是具备双重能力的复合型角色——既理解临床诊疗流程和医疗数据的产生逻辑,又掌握数据治理和分析的技术能力,能够在临床科室和数据团队之间充当"翻译器"和"桥梁"。这种人才的培养在现行高等教育体系中几乎没有对应的专业设置:医学院的医学信息学方向长期处于边缘地位(多数作为选修课而非核心专业),而计算机学院和公共卫生学院又缺乏对临床工作流的深入理解。

人才供给的不足不仅体现在"没有足够的人",更体现在"没有职业晋升通道"——一个有医学背景的数据分析人才,在医院体系中属于"辅助科室",晋升路径不清晰;在数据企业中,又可能因为"没有纯计算机背景"而在技术序列中处于劣势。

(三)"1"个重点——数据赋能人工智能——在医疗领域的具体含义

原文:"人工智能+"行动到哪里,高质量数据集的建设和推广就要到哪里,推动"人工智能+"与"数据要素×"同频共振。

这是"531体系"的唯一重点,也是与医疗数据关系最为直接的战略部署。

在医疗领域,"人工智能+"的主要落地场景包括三个方向:AI医学影像辅助诊断——以肺部结节CT筛查和眼底视网膜病变筛查最为成熟,三类证产品已超过60款;AI驱动的药物研发——分子生成模型、靶点-配体结合亲和力预测、临床试验患者匹配;大语言模型在临床工作流中的应用——病历自动摘要、智能导诊、患者健康教育和随访管理。

这些场景的共同瓶颈不是模型架构设计,而是训练数据。当前中国医疗AI模型面临的数据问题可以概括为三个"单"字:单中心——训练数据来自单一医院或单一地区;单设备——训练数据来自同一品牌或型号的影像设备;单人群——训练数据的患者人口学特征代表性不足。由此引发的一个具体问题是分布外泛化——在A医院训练的高精度模型部署到B医院后,因为设备型号不同导致的成像特征偏移,准确率可能显著下降。这不是模型本身的问题,而是数据的多样性和代表性不足。

更根本的问题是:原文说的"高质量数据集的建设和推广",目前在医疗领域缺乏一个系统性的推进机制。如果每一个AI医疗器械的注册审批环节,审评机构能够同时评估"申报产品所依赖的训练数据集是否具有多中心、多设备、多人群的代表性"——这就会形成一种正向的激励机制,驱动企业和医院主动建设高质量、有代表性的多中心数据集,而不是满足于"用自家医院的几万例数据训一个模型然后报证"。

五、从分析到行动:四步破解

将上文的分析转化为可操作的路径,需要在四个方向上同时发力。每一条建议都直接回应原文的一个核心判断,也直击上文分析的一个结构性障碍。

第一步:设立医疗数据合规流通"安全港"条款,回应原文"破除体制机制障碍"

上文的制度分析指出,医院"不敢共享数据"的根源不是政策不允许,而是没有责任豁免条款——在"做了可能被追责"和"不做永远安全"之间,理性人选择后者。改变这个激励结构,唯一的办法是让"做了且合规"等同于"不做一样安全"。

具体设计:由国家数据局与国家卫健委联合出台《医疗数据合规流通责任豁免清单》,明确在同时满足以下四项条件的前提下,数据供方(医院)不承担因数据后续流通产生的个人信息安全责任——

第一,数据经国家认可或地方标准(如北京《健康医疗数据匿名化技术规范》)规定的脱敏方法处理,重识别风险低于规定阈值;

第二,数据通过经认证的隐私计算平台流通,"数据可用不可见";

第三,患者被以泛化知情同意或opt-out机制告知,并享有撤回权;

第四,数据流通在认可的数据交易场所完成合规登记,具备可追溯的审计日志。

国际参照:美国HIPAA Privacy Rule的Safe Harbor条款规定,去除18类标识符(包括姓名、地理信息小于州一级、日期元素精确到年以外、电话号码、电子邮件地址、社会安全号码、病历号、健康计划受益人号码、账户号码、证书/许可证号码、车辆识别码、设备标识符、URL、IP地址、生物识别标识符、全脸照片、其他唯一识别码)后的健康信息被视为"去标识化信息",不再受HIPAA隐私规则约束。美国卫生与公众服务部进一步提供了Expert Determination方法——由具备统计和科学知识的专家评估并出具书面结论,确认重识别风险"非常小"。

中国已有了《个人信息保护法》第4条对"匿名化"的定义("个人信息经过处理无法识别特定自然人且不能复原"),也已有北京《健康医疗数据匿名化技术规范(试行)》作为技术标准参照。现在缺的是把技术标准和法律责任豁免之间的逻辑链条正式打通——让符合标准的脱敏行为在法律上获得确定性的豁免效果。这一步如果不能迈出去,任何关于医疗数据流通的倡议都将在医院的合规部门那里碰壁。

第二步:以专科联盟为单元建立"数据协作网",回应递进式释放路径在医疗领域的断裂

上文的分析指出,医疗机构数据从"内部自用"到"协同优化"之间存在合规成本的断崖式跃升。架设这道"合规桥梁"的最务实方案,不是在2800多家三级医院之间一次性建立全国性数据共享网络——这在治理上不可能实现——而是利用已有的专科联盟和专科医联体体系,在单一专科范围内先跑通标准、协议和合规的全部流程,验证可行后再向其他专科复制。

具体路径:由国家临床医学研究中心和国家区域医疗中心的牵头单位主导,在联盟内部统一三项基础设施——

统一数据字典:基于SNOMED CT等国际术语标准的专科化本地扩展,覆盖该专科的核心临床数据元;

统一脱敏规则:不同病种数据设定差异化的重识别风险阈值——例如罕见病的重识别风险天然高于常见病,需要匹配更强的脱敏参数;

统一知情同意模板:设计为"泛化知情同意+opt-out撤回"模式,一份同意书覆盖联盟内所有参与机构的合规研究用途,患者可随时撤回,撤回前已完成的研究不受影响。

技术路线:联邦学习+可信执行环境作为数据不出院的保障,在联盟各节点之间部署统一的计算中间件。

试点范围:每个省选择2-3个有成熟联盟组织架构的专科(如国家呼吸医学中心牵头下的呼吸专科联盟、国家癌症中心牵头的肿瘤专科联盟),覆盖至少5个地市的联盟成员单位。试点周期12-18个月,核心验证指标包括:数据在联盟内完成一次完整的多中心联合分析(如一个多中心队列的基线特征统计)所需的时间和合规步骤数;联盟内各机构数据质量的一致性评分;数据安全事件的零发生率。

第三步:设计"数据协作收益分成"机制,解决成本与收益承担主体分离的结构性矛盾

上文指出,医疗数据流通的核心障碍之一,是数据安全成本由医院承担、但流通收益主要归属于数据使用方——成本与收益的主体分离导致供给端动力为零。一个可持续的医疗数据流通生态,必须让医院从"数据的单向输出者"变为"数据协作的利益相关者"。

操作路径:医院贡献经脱敏处理的临床数据 → 第三方数据治理服务机构(以合规担保方身份)进行质量评估和数据产品化加工 → 数据产品在北京国际大数据交易所等认可平台登记挂牌 → 数据使用方(药企/AI公司/科研机构)购买数据产品的使用权 → 交易收益按约定的比例返还数据供方医院。

收益穿透机制是成败的关键。收益分配必须穿透到医院内部——一部分作为医院信息系统建设和数据治理的专项基金,另一部分进入贡献数据的临床科室和参与数据治理的个人或团队。这里的逻辑是:数据质量越高 → 数据产品的市场需求和价值越大 → 收益越多 → 反过来激励科室和编码员提升病历书写质量和编码准确性——形成一个正向反馈。当前医院病案室的编码员在大多数医院中属于"后台辅助岗位",待遇和职业认可度偏低。如果数据治理的质量能够转化为可量化的数据产品收益并反哺到个人,整个链条的动力结构将发生根本性变化。

实践参照:扬子江药业在江苏省完成了首单公共数据产品交易,虽然交易标的为企业数据而非医疗机构数据,但交易流程——数据确权登记、质量评估、挂牌交易、收益结算——已经跑通了制度链路,可以复制到医疗机构的临床数据场景。下一个需要验证的案例是:一家三甲公立医院将其某个专科的脱敏数据正式登记为数据产品并在交易所完成首单交易——这将是医疗数据从"资源"走向"资产"的定义性时刻。

第四步:将"数据要素×"大赛的医疗赛道成果转化为规模化应用,回应原文"人工智能+与数据要素×同频共振"

刘烈宏于2026年5月启动"数据要素×"大赛,医疗健康是重点赛道之一。历届数据类竞赛的一个共性问题是:获奖方案停留在"技术验证+PPT演示+新闻通稿"层面,赛后缺乏制度化的落地推动机制。

建议由国家数据局和国家卫健委共同建立"数据要素×大赛医疗赛道获奖方案落地跟踪机制":为每个获奖的医疗数据应用项目匹配一个试点城市和一个监管沙盒名额,授予12个月的时间窗口,在限定范围内豁免或简化部分常规监管要求(如遗传办审批、伦理审查的多中心重复备案),允许项目团队在真实环境中跑通从技术验证到规模化应用的完整闭环。沙盒期结束后,由国家数据局和卫健委联合评估,决定是否将已验证的模式推向更大范围。

国际参照:新加坡卫生科学局为数字健康产品设立的监管沙盒制度,符合条件的创新产品可在6-12个月的沙盒期内,在受控环境下部署并收集真实世界使用数据,沙盒期内适用简化的监管要求。英国药品和健康产品管理局的"创新通行证"也有类似功能。

这种制度设计的本质,是承认医疗数据领域的创新天然具有"监管不确定性"——在规则不完善的领域进行创新,必然会面临现行规则未覆盖的灰色地带。与其让创新者自行承担这种不确定性的全部风险(结果通常是创新被放弃),不如由国家提供一个受控、受限但有明确保障的试验空间。这既是保护创新,也是加速规则迭代——沙盒期内暴露的问题,可以反过来为正式制度的制定提供实证依据。

六、结语:医疗数据价值释放的衡量标准

回到刘烈宏原文贯穿始终的核心判断:

"市场化是手段,价值化是目的。"

对医疗数据而言,这个判断比任何技术方案或制度设计都更具根本性的校正作用。它提醒我们:讨论医疗数据要素市场化配置改革的时候,始终不要迷失在"交易""定价""流通"这些市场化工具中,而忘记了这些工具的最终目的——让数据创造临床价值、科研价值和公共卫生价值。

医疗数据改革成功的衡量标准,不是数据交易额的数字,不是交易所挂牌产品的数量,更不是某个医院的"数据资产估值"。真正的衡量标准是更朴素的三件事:一个基层医院的医生在诊疗时,能不能得到基于多中心真实世界数据的决策支持;一个罕见病患者能不能在第一次就诊——而不是辗转十家医院之后——被准确识别;一种新药在中国人群中的长期安全性,能不能被一个覆盖多地区、多层级医疗机构的数据网络持续主动监测。

已有的进展值得认真对待:北京的医学影像云平台已经证明,当一个城市下决心推动数据互联互通时,技术不是障碍;山东的可信数据空间正在验证,数据可用不可见的技术路线在健康医疗场景中是否可行;北京同仁医院与拜耳医药、恒瑞医药的数据合作探索了"公开撮合+合规框架"的可行模式;北京《健康医疗数据匿名化技术规范》为脱敏标准的全国统一提供了模板。

但火种不等于燎原。从单个案例到系统性的制度安排,中间需要的不是更多的文件,而是敢于在关键环节完成制度突破的勇气——出台责任豁免条款,让"合规共享"的医院不承担不可预见的后续风险;设计收益分配机制,让贡献高质量数据的医院和个人获得可量化的回报;开放监管沙盒,让创新方案在受控环境中验证可行性而非在灰色地带中自行承担不确定性。

这些突破一旦完成,将撬动的不仅是医疗数据流通的量变,而是一个根本性的质变:中国的医疗数据从"富矿沉睡"走向"价值释放",全球最大患者人群的数据优势转化为真实世界证据的产业优势,最终让14亿人的每一次就诊,都因为数据的流动和智慧的汇聚,而比上一次更精准、更安全。


特别声明:智慧医疗网转载其他网站内容,出于传递更多信息而非盈利之目的,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。

凡来源注明智慧医疗网的内容为智慧医疗网原创,转载需获授权。


Copyright © 2022 上海科雷会展服务有限公司 旗下「智慧医疗网」版权所有    ICP备案号:沪ICP备17004559号-5