欢迎访问智慧医疗网 | 网站首页
 
当前位置:首页 > 医疗大数据

大数据和人工智能对医学的影响、挑战和潜在策略分析

发布时间:2025-03-04 来源:北大医学科研 浏览量: 字号:【加大】【减小】 手机上观看

打开手机扫描二维码
即可在手机端查看


微信图片_20250304095123.png

1文章摘要


目的   本研究旨在探讨影响医学大数据和人工智能的治理管理的重要因素及其引起的挑战与问题,为提出相应的解决方案提供依据。

方法   我们借鉴现有文献,简要分析大数据和人工智能对医学研究的影响。通过讨论分析影响数据治理管理的核心要素及其相互关系,提出一些潜在的策略,来解决与医学大数据和人工智能相关的主要挑战与问题。

结果   大数据和人工智能的应用显著影响医学研究范式、药物研发、临床决策和医学教育。这些应用引起数据治理管理相关的挑战分为两个主要方面。第一涉及由技术核心因素引发的伦理挑战。其主要问题是在数据收集、编码和反馈这些算法过程可能存在的偏差。第二涉及数据和利益相关者两大治理管理要素,其主要问题是基础数据的质量和整合效率低下,以及数据产权和数据相关知识产权缺乏认可的认定体系,其在确定数据共享和应用期间在利益相关者之间的权益分配和责任归属方面至关重要。

结论 应解决医学中大数据和人工智能的治理和管理的关键问题。这些措施包括制定数据伦理框架,包括医学人工智能的伦理审查策略和审查要点;建立数据结构标准以提高数据质量和交互性;以及明确关于数据所有权、知识产权及其权益分配的决策原则。

微信图片_20250304095223.png

2文章节选

算法和人工智能偏倚引起的伦理问题

医学大数据应用和人工智能的基础是复杂算法,算法及其偏倚引起的伦理问题。算法一般包括训练(Training)、编码(Code)和反馈(Feedback)三个主要过程。三个过程中都可能使人工智能产生结果偏倚。“没有任何算法或团队是完美的,但争取最佳状态很重要。”对于算法的伦理问题,在《数据科学原则》中,哈佛大学Dustin Tingley教授概述算法中可能产生偏差的原因。训练ML算法是基于数据,因此,训练可能因为数据集不具有代表性导致算法出现偏差;算法是由人类编写的,即使可能是无意的,也可能因为失误出现偏差。算法可以从用户的反馈中学习。但也可能会受到有偏差的反馈的影响。算法结果和结论的偏倚可能会对人造成严重的伤害,因此引起重大伦理挑战,这在医学领域尤为重要。研究表明,人工智能临床研究报告存在不足越来越获得认可。2019年,一综述系统回顾了20 500多篇文章,发现其中设计和报告足够稳健而使审稿人对文章结论有信心的文章不到1%。类似地,大多数使用ML模型进行医学诊断的研究也没有足够的细节来说明如何对这些模型进行评估或复制。电子健康记录中ML模型的报告也不一致,只有12%的模型进行了外部验证。

医学大数据和人工智能从伦理的角度不仅涉及数据伦理和人工智能伦理,还要充分考虑医学伦理规范。算法和人工智能的风险在医学应用产生的后果是严重的,甚至是威胁个体或群体的生命。以G-AI为例,其结合了计算机科学和统计学技术,使用来自更大的数据集的许多参数的大型模型,可能被描述为非常有效的统计推断。这些模型预测复杂的输出——如文本响应、计算机代码、详细的文章,——从人类语言书写或视频。但G-AI已被证实被称为“幻觉”的潜在错误风险,对于医学领域的应用具有严重风险。

对于算法程序引起的伦理问题,解决策略在于两个方面:

(1)通过伦理审查,在医学大数据应用和人工智能计划实施前进行审核,尽量减少伦理问题。这也符合国际医学伦理准则和指南的趋势和要求。《赫尔辛基宣言》2024修订版的贡献之一是保护对象从受试者扩展到个体参与者,将数据个体——个人信息主体纳入了伦理保护和规范范围。因此,基于大数据的医学人工智能不仅需要尊重通用的数据治理管理规范,还要符合医学伦理原则,因此具有伦理审查依据的适用冲突。国内外缺乏关于数据处理应用,涉及算法的科技活动的伦理审查的经验和指导。

(2)从数据源头减少偏倚性。引起算法偏倚的重要原因是数据质量和交互性问题算法结果产生偏倚的环节之一是基础数据,包括G-AI。以LLM幻觉为例,导致这些幻觉的因素仍然是包括数据质量、训练过程和推理挑战。这提示医学大数据和人工智能另一重要治理问题——数据集的质量和代表性保证。算法的潜在风险和挑战本质上与大数据的属性和特征有关。具体来说,准确性和价值是科学数据的基本属性要求。但诸如容量、速度、多样性和可变性等因素决定了在大数据应用程序中所面临的数据的不确定性。处理来自临床诊断和治疗的大数据的挑战同样不仅仅是数据量,还包括数据处理的复杂性。特别是不同来源的数据的结构等导致无法或很难整合,这在真实世界数据和研究数据都存在的问题。

算法,包括人工智能需要具有代表性的客观、真实的完整的数据,经过数据清洗,需要大数据集成到一个结构化的数据管理系统中,使复杂的数据库管理和分析系统可实现连续的分析。因此,大数据和人工智能真正的技术挑战来自于大数据固有的多样性和可变性。不同来源的数据集增加数据的权威和代表性,但是,数据源、结构、内容和质量存在较大差异,导致异源异构数据的质量和数据交互性是大数据应用和数据驱动人工智能亟待解决的问题。

亟需解决的治理管理问题——数据产权和知识产权及其归属

随着数据共享和数据交易的探索实践,大数据和人工智能的治理管理还面对一个亟待解决的问题,即数据产权和知识产权问题。大数据产权和知识产权认定困难与大数据的属性特征相关,也与数据不同于现有其他物品的特性相关,即可再生和重复性拥有。目前,数据的价值和利益权开始得到承认,但数据产权和知识产权缺乏统一认可的大数据产权框架和明确的法律规定。

大数据表现出与传统产权目标不同的特征和多维属性,学者们尚未就这个问题达成共识。数据的表达并不仅仅局限于数值,还包括文本、语言、位置和它们之间的相互关系。大数据中固有的信息的来源、类型、结构和量给其产权的识别带来了前所未有的复杂性和挑战,使得传统的单一产权方法无法满足。大多数现有研究得出的结论是,当前的产权和知识产权框架不适合大数据的独特性质。但是,大数据权利和收益的依据对于数据共享和交易是不可或缺的,目前对大数据及其应用的产权和知识产权还缺乏明确的规定和完善的做法。

随着大数据及其应用成为创新和经济战略的关键点,大数据的控制权及其承认已成为法律学术论述和辩论的突出话题。我们认为大数据应用中的权益与控制权有着本质上的联系,承认数据控制权是解决数据收益的一个潜在方案。但对大数据控制权的承认明显缺乏被广泛接受的原则、方法和框架。此外,鉴于大数据与公民的健康和福祉以及社会福利之间的相关性,在确定财产权及其利益时应考虑到更广泛的因素。一旦产权和知识产权制度建立,也应有强制许可的具体规定或要求。



智慧医疗网 © 2022 版权所有   ICP备案号:沪ICP备17004559号-5