2025年12月31日,“北京市健康医疗高质量数据集宣介会”在京圆满落幕。本次会议由北京市卫生健康委员会主办、北京医疗健康大模型有限公司承办,京内外近百家机构逾200位代表共聚一堂,共话医疗数据发展的新机遇与新未来。
北京市卫生健康大数据与政策研究中心郭默宁主任就《技术规范》内容展开解读。她指出,这份规范立足卫生健康行业特点与实际工作需求,着重强调数据价值挖掘与个人信息保护相平衡的核心原则:一是结合行业数据特点,以患者为中心的全生命周期多模态数据关联需要相关标识为保留数据价值,明确由数据持有方对原始数据进行治理和关联后,再匿名化处理;二是依据具体使用场景,选取适宜技术进行匿名化处理确保数据使用方“无法识别特定自然人且不能复原”;三是针对特定场景采取差异化技术手段在保障数据可用性的同时,有效控制数据流通安全风险,实现隐私保护与数据价值的平衡。
《技术规范》共八章:一、适用范围;二、引用文件;三、术语定义;四、总则;五、实施流程;六、处理方法;七、效果评估;八、保障措施。为确保《技术规范》的专业性、科学性和实用性,编制工作广泛吸纳产业界与学术界力量,邀请了行业专家组成起草工作组,系统研究相关法律法规、国家标准及行业实践,结合北京市健康医疗数据开发利用的实际场景,经多轮研讨、实际案例推演,形成草案;在草案基础上,组织清华大学、中国电子技术标准化研究院、蚂蚁集团、腾讯、飞利浦等机构的数据安全、标准化及医疗行业专家开展评审,充分吸纳评审意见并完善定稿。
适用范围:
本规范适用于健康医疗数据开发利用过程中对个人信息的匿名化处理,可为健康医疗数据的匿名化工作提供指引,也可为监管部门进行数据开发利用监督管理提供参考。
相关主体:
数据持有方:履行安全与合规义务,做好多源数据的有效整合,确保原始数据完整、一致。匿名化处理后的数据不属于个人信息,可依法合规安全流通至数据使用方;
数据运营方:依法依规在授权或委托范围内开展数据资源开发、数据产品经营和技术服务;
数据使用方:依法合规对数据进行开发利用,确保开发利用环节的安全、合规。
目前,《技术规范》已落地具体项目并完成实践验证,取得良好应用成效。下一步,将结合技术发展与实践反馈,建立动态更新机制,不断完善健康医疗数据匿名化技术标准体系,支撑行业数据高效流通和有序开发利用。
1、前5家将成为首批"创始合作伙伴"
享受数据集打包优惠;
提供AI产品迭代真实应用场景;
附赠稀缺权益独家"专家护航":年度技术顾问服务,享受专家团队的优先深度支持。
2、数据交付顺序"队列优先权"
所有数据集的加工、交付与后续更新,将严格按照签约顺序进行;
以具有法律效力的合同签订时间为准。
3、联合署名品牌曝光机会
在数据集相关的学术论文发表(如数据集的规范论文)、行业白皮书发布时,可作为"合作构建单位"联合署名,提升行业影响力。
2026年,北京胸科医院拟完成10万例覆盖全肺部疾病的精标注高质量数据集,构建我国全肺部疾病多模态数据集和大模型研发。
由北京地坛医院构建的“多中心医疗术语与标准模板数据集”也在会上亮相。该数据集涵盖海量标准化病历模板与临床术语,兼具数据体量大、维度广、质量高三大核心优势,其潜在转化方向可分为五大类:
1、智能临床辅助系统:作为核心知识库,嵌入更多智能临床决策支持(CDSS)、智能导诊、自动病历质控等系统;
2、医疗信息化解决方案:为医疗软件开发商提供标准化的术语服务和模板组件,提升其产品标准化水平;
3、医学教育与规范化培训:用于医学生、住院医师的病历书写规范化培训及考核;
4、医防融合与院感防控:基于临床输入频次的特定监控,为新发突发传染病、院感防控等提供预警模型;
5、医疗数据服务及AI训练:在严格合规前提下,探索作为标准化数据产品,为保险、医药研发、公共卫生管理等领域提供数据服务。
该数据集已在实际应用中形成成熟的交易案例,打造出医疗行业专属输入解决方案--腾讯搜狗输入法医疗版,助力临床文书规范化与效率提升。
为满足多元化合作需求,医院同步推出四类合作模式如下:
联合开发,收益共享;
标准授权,即购即用;
子集授权,按需组合;
定制增强,专属交付。
基于此次建立的政策保障与典型合规实践,国家人工智能应用中试基地(医疗领域)将持续深化高质量医疗数据集的共建共享,全力推进数据开放赋能与产业生态培育。