过去医院谈医疗数据产品,最难回答的问题不是“有没有数据”,而是“这个数据到底值多少钱”。同样是一个糖尿病专病数据集,有的只能作为科研辅助材料,有的可以支撑真实世界研究,有的可以用于预测模型训练,有的还能进入可信数据空间,以计算服务的方式持续产生收益。它们看起来都叫“数据集”,但价值完全不同。
GB/T 46353—2025《信息技术 大数据 数据资产价值评估》的出台,真正改变的不是一句“数据可以估值”,而是给了医院一个更清晰的判断框架:
不是所有数据都能估值。
能被估值的,是权属清楚、质量可评价、场景明确、收益可解释、风险可控制的数据资产。
因为医院真正有价值的,从来不是把HIS、LIS、EMR、PACS里的原始数据拿出来“打包出售”。真正有价值的,是围绕特定临床问题,经过治理、加工、标注、质控、授权和安全交付后形成的数据产品。换句话说,医疗数据产品的估值,不应该从“有多少条数据”开始,而应该从“这批数据能解决什么问题”开始。先把一个误区讲清楚:医疗数据估值,不是给原始病历标价它既涉及患者个人信息和隐私,也涉及医疗质量、安全责任、伦理边界和公共利益。医院不能把原始病历、原始检验结果、原始影像文件简单理解为可以直接交易的商品。所以,医院要做估值,第一步不是问价格,而是先界定估值对象。更适合落地的估值对象,通常不是“全院三年数据”这种粗放说法,而是以下几类产品化对象:例如心衰、糖尿病、肺癌、胃镜围检查期低氧风险、慢病管理等专病队列数据集。它们有明确疾病边界、入排标准、变量字典、结局定义和时间窗口。例如用于疗效、安全性、经济性、依从性、复诊转归、疾病进展等研究的数据产品。它的价值不只在数据量,而在能否支撑可审计、可复算、可发表、可用于证据建设的研究过程。这类数据的价值更高,但要求也更高。它必须经过采集、加工、清洗、标注、质控和模型验证,能够直接用于人工智能模型开发和训练,并证明可以提升模型性能。这也是医疗行业更容易合规落地的方向。医院不直接交付原始数据,而是在可信数据空间、隐私计算环境、沙箱或TEE环境中,让外部合作方在授权范围内调用计算能力、完成统计分析、模型训练或算法验证。这种模式下,交易的重点不是“数据副本”,而是“数据产品的授权使用能力”和“基于数据的计算服务能力”。
GB/T 46353—2025的一个重要逻辑,是把数据资产价值评估分成两个层次:
先做数据评价,再做价值评估。
过去很多医院谈数据合作,容易直接进入价格谈判:一个数据集多少钱?一个病种多少钱?一例病例多少钱?
- 是否有缺失率、异常值、重复记录、时间逻辑错误的质控结果?
这些问题没有回答清楚,数据量再大,也只能算“数据资源”,很难成为高价值“数据资产”。对医院来说,估值不是财务部门单独完成的事情,也不是信息科导出一张表就能完成的事情。它需要医务、信息、科研、伦理、法务、财务、资产管理、数据治理团队共同参与。医疗数据产品的估值,本质上是一项“数据资产工程”。从实务角度看,医院医疗数据产品估值最容易落地的,仍然是三条路径:成本法、市场法、收益法。但这三种方法不能照搬传统资产评估逻辑,必须结合医疗数据特点重新理解。特别是在一个数据产品还没有交易案例、还没有稳定收益、还没有明确市场价格时,成本法可以作为基础估值方法。这批数据产品,是医院投入资源建设出来的。既然有投入,就应当有价值基础。医疗数据产品的成本,不只是信息科导出数据的人工成本。真正应该纳入测算的,是数据产品形成全过程的成本。包括:
因为这些工作分散在信息科、临床科室、科研团队、数据公司、伦理办和法务部门,没有被统一核算。但站在数据资产角度,这些投入恰恰是医疗数据产品价值的底座。如果医院只是把成本理解为“导表成本”,估值一定偏低。
如果医院把数据产品当成一个经过治理、加工、标注、确权、质控和安全交付的专业成果,成本法就会自然抬高估值基础。
成本法看似只是算投入,但高质量数据集标准会显著改变成本结构。因为高质量数据集不是“清洗过的数据”,而是可以直接用于AI模型开发和训练、并能有效提升模型性能的数据集合。
这意味着医院在建设阶段多做的工作,未来都可以成为估值理由。例如不要笼统建设“心血管数据集”,而是建设“院内心血管风险预测模型数据集”“NT-proBNP连续监测与心衰风险数据集”“胃镜围检查期低氧风险预测数据集”。问题越具体,变量、结局、样本边界越清楚,数据产品越容易被使用,估值越高。字段名称、单位、时间点、来源系统、缺失规则、异常值处理方式,都要写清楚。例如影像标注、病理分型、用药线别、疗效评价、不良事件、疾病进展、复发转移、死亡结局、并发症判定,这些都需要专家参与。如果医院能把专家标注过程、标注规则、复核机制、分歧处理流程留下来,数据产品的价值会明显高于普通抽取型数据集。高质量数据集的核心不是“看起来很干净”,而是“真的能提升模型性能”。因此,医院可以在估值材料中增加一项非常关键的证明:比如AUC、F1、准确率、召回率、校准曲线、决策曲线、外部验证结果是否改善。这一步会把数据产品从“成本投入型资产”推向“效果证明型资产”。方案二:市场法——用可比交易给数据产品找“市场坐标”市场法适合在数据交易所挂牌、成果转化、许可授权谈判时使用。市场上类似的数据产品、类似的授权方式、类似的使用场景,大概是什么价格?
可比案例还不够多,公开价格还不够充分,交易条件差异很大。所以,医院不能简单拿“某医院某数据集成交十万元”来套用自己的数据产品。
真正可比的,不只是数据名称,而是至少要比较以下几个维度:- 数据模态是否相同,例如结构化病历、检验、影像、病理、基因、随访、可穿戴设备数据;
- 授权方式是一次性许可、按年许可、按项目许可,还是按调用次数收费;
- 使用场景是科研、模型训练、药物真实世界研究,还是商业化产品开发;
- 交付方式是数据文件、API、可信数据空间,还是隐私计算服务;
- 是否允许二次开发、衍生成果使用、论文发表、模型商业化。
市场法的关键,不是找到一个“看起来差不多”的价格,而是建立调整系数。
同样是肿瘤数据集,一个只有诊断和用药记录,一个包含分期、病理、基因、治疗线别、疗效评价、生存结局和不良反应,市场价值完全不同。同样是影像数据集,一个只有原始DICOM文件,一个有高质量标注、病灶轮廓、专家复核、模型验证结果,估值也不可能一样。
医院要提升市场法估值,关键是把数据产品做得“可比较、可披露、可验证”。
例如完整性、准确性、一致性、规范性、时效性、可访问性,每一项都给出可量化结果。
因为购买方或使用方需要再投入的清洗、标注、质控和验证成本越低,数据可直接使用的程度越高。医院可以把本院历史合作项目、区域数据交易案例、数据交易所挂牌案例、第三方评估案例逐步沉淀下来。未来估值时,不再凭感觉谈价格,而是有可比案例、有调整逻辑、有定价依据。因为数据的价值,最终不在数据本身,而在它能带来的收益。
但医疗机构使用收益法时,不能简单套用商业公司的利润模型。医院更适合从“授权使用收益”“计算服务收益”“成果转化收益”“成本节约收益”“科研和产业合作收益”几个角度测算。
- 保险、医保、医院管理部门为风险预测、费用控制、患者管理支付服务费;
- 医院基于数据产品形成科研成果、论文、专利、软件著作权、数据知识产权和成果转化收入;
- 医院通过数据驱动管理降低成本、提升效率、优化资源配置。
- 一类是已经有明确购买方的产品。比如药企明确需要某个适应症真实世界数据,用于安全性、有效性、经济性证据建设。
- 一类是可以持续调用的计算服务产品。比如可信数据空间中的按项目分析、按模型训练、按API调用、按年度授权服务。
- 一类是能直接支撑AI产品开发的数据集。例如用于影像诊断模型、病理模型、临床预测模型、用药审核模型、慢病管理模型训练和验证的数据集。
收益法下,高质量数据集的价值提升最直接。
因为高质量数据集可以直接影响模型效果、研发周期、研发成本和商业化确定性。如果一个数据集能让模型AUC从0.75提升到0.83,或者让模型在外部验证中的校准效果更稳定,它的价值一定高于普通数据集。字段缺失、单位混乱、结局不清、标注不一致,会让大量时间浪费在返工上。如果医院提供的是已经完成标准化、标注、质控和模型验证的数据集,购买方的开发周期会缩短,数据产品就可以获得更高溢价。单中心数据有价值,但多中心、跨区域、跨设备、跨人群的数据更有价值。尤其在医疗AI和真实世界研究中,外部验证能力直接决定数据产品的上限。如果一个数据产品可以证明模型在不同医院、不同设备、不同患者群体中表现稳定,它就不是普通数据集,而是具备“迁移验证价值”的高质量数据资产。如果医院可以按季度或年度更新数据,持续纳入新病例、新随访、新结局,并在可信数据空间中持续提供授权计算服务,这个数据产品就具备长期收益基础。如果数据权属不清、授权不明、脱敏不充分、日志不可追溯、使用边界不明确,估值一定会被打折。相反,如果医院通过可信数据空间实现“数据可用不可见”,并配套授权协议、日志审计、用途控制、结果审核、退出机制,风险折扣会下降,估值自然上升。
医疗数据产品估值 = 建设成本底座 × 数据质量系数 × 场景价值系数 × 权利范围系数 × 稀缺性系数 × 合规风险折扣
这个公式不一定用于最终评估报告,但非常适合医院内部立项、成果转化、合作谈判和挂牌前测算。例如,一个普通结构化数据集,可能只能按成本法估一个基础价格。但如果它进一步完成了专病队列建设、医生标注、终点判定、质量评分、模型验证,并且能在可信数据空间中按年授权使用,它的估值逻辑就完全不同。它是一个可以持续产生研究价值、模型价值、证据价值和交易价值的数据产品。真正有效的办法,是把数据产品从“资源型”做成“资产型”,再做成“产品型”,最后做成“服务型”。
- 服务型数据,强调“我能持续授权、持续计算、持续产生收益”。
未来医疗数据产品最有价值的形态,很可能不是一次性卖数据,而是基于可信数据空间的计算服务许可授权。
这样形成的,不是一单数据买卖,而是一套可持续的数据资产运营机制。如果医院今天想真正启动医疗数据产品估值,可以按六步走。
- 第一步,选场景。不要从全院数据开始,而要从临床价值高、数据基础好、外部需求明确的专病或专科开始。
- 第二步,定产品。明确数据产品名称、使用对象、应用场景、授权方式和交付环境。
- 第三步,做治理。完成数据抽取、清洗、标准化、脱敏、匿名化、质控、数据字典和版本管理。
- 第四步,做高质量数据集升级。围绕AI模型开发和训练要求,完成变量体系、标注规则、专家复核、训练验证测试集划分和模型验证。
- 第五步,做估值。成本法定底价,市场法找坐标,收益法看上限。三种方法组合使用,而不是选一个方法走到底。
- 第六步,做交易和运营。通过数据交易所、成果转化协议、许可授权协议、可信数据空间、日志审计和收益分配机制,实现长期运营。
GB/T 46353—2025来了以后,医疗数据产品估值不会变得更简单。因为未来真正能被认可的估值,必须经得起权属追问、质量追问、场景追问、收益追问和合规追问。但这对真正愿意做数据治理、专病队列、高质量数据集和可信数据空间的医院来说,是好事。过去,医院的数据价值被低估,是因为数据没有被产品化。未来,医院的数据价值能被释放,靠的也不是简单把数据拿出去,而是把数据变成:
谁能把数据做得更标准、更可信、更可用、更能提升模型性能,谁就能在下一轮医疗AI和真实世界证据建设中,获得更高的数据资产价值。
特别声明:智慧医疗网转载其他网站内容,出于传递更多信息而非盈利之目的,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。
凡来源注明智慧医疗网的内容为智慧医疗网原创,转载需获授权。