欢迎访问智慧医疗网 | 网站首页
 
当前位置:首页 > 医疗人工智能

医疗人工智能的三个时代

发布时间:2024-05-28 来源:医学AI在线AIMonline 浏览量: 字号:【加大】【减小】 手机上观看

打开手机扫描二维码
即可在手机端查看

人们对人工智能(AI)的兴趣达到了前所未有的高度。整个医疗保健领域的领导者都面临着在何处、何时、如何部署AI,以及如何了解其风险、问题和可能性等问题。


各种AI的能力和风险明显不同。

正如在制定治疗方案时将细菌和病毒感染归为一类可能会导致错误的临床结果一样,将不同种类的AI归为一类可能会将医疗决策者引向错误的道路。


来自美国的学者将AI分成了简单实用的AI三个时代的框架,可以帮助决策者在技术变革的今天了解不同类型人工智能的优势、劣势和挑战。

我们今天一块学习一下。

微信图片_20240526083346.png

人工智能 1.0:符号 AI 和概率模型

在人工智能发展的最初 50 多年里,大多数人工智能都专注于将人类知识编码成机器规则。我们可以将其理解为许许多多的 "如果-那么 "规则或决策树。这种符号人工智能取得了一些非凡的成就,例如 IBM 的 "深蓝"(Deep Blue)在 1997 年击败了国际象棋世界冠军。在医疗保健领域,INTERNIST-I 等工具旨在表达有关疾病的专家知识,以帮助处理具有挑战性的病例。

符号人工智能也有一些关键的局限性,特别是在构建过程中始终存在人为逻辑错误的风险,而且由于其知识库完全依赖于创建者,其规则中也存在偏见。但最重要的问题可能是,从经验上看,符号人工智能存在基本能力限制,在面对真实世界的情况时显得脆弱不堪。

作为回应,研究开始更多地关注概率建模,如传统的回归和贝叶斯网络,这使得专家知识和经验数据都能为推理系统做出贡献。这些模型能更优雅地处理现实世界中的情况,并在医疗保健领域找到了一些用武之地,但在实践中难以扩展,管理图像、自由文本和其他复杂临床数据的能力有限。

人工智能 2.0:深度学习时代

研究更多数据驱动方法的工作,即广义上的机器学习,植根于这样一种理念:智能的关键是从错误中学习。20 世纪 80 年代和 90 年代的错误反向传播等发现奠定了基础,但真正的革命发生在 2010 年代初。随着数据集的增长和计算机速度的加快,使用多层神经网络的深度学习开始发挥其作用,人工智能 2.0 时代开始了。

首先,卷积神经网络架构赋予了计算机 "看 "的能力,它们获得了对照片中的图像进行分类(如 "猫 "与 "狗")的能力。如今,在手机上搜索成千上万张照片是一件轻而易举的事,无需手动为每张照片标注内容。个人甚至可以识别照片中自己一无所知的事物,如特定类型的植物。语音识别已司空见惯。人们可以在 100 多种语言中进行翻译,无论是通过打字还是将相机对准使用他们不懂的语言书写的单词。

深度学习还让医疗保健领域的新事物变得实用。本世纪《美国医学会杂志》(JAMA)上最具影响力的一篇文章显示,眼科医生可以从视网膜照片中识别出糖尿病视网膜病变。研究人员还在乳腺癌和肺癌筛查、病理学、皮肤病鉴定以及从电子健康记录数据中进行预测等诸多领域取得了突破性进展。

深度学习算法从标有基本事实("这张图片是一只猫")的示例中学习。然后,它们学习模式,而不是通过编程来确定模式是什么。在这个时代,对计算机进行编程学习比用专家提供的规则硬编码要容易得多,至少在许多任务中是如此。这些模型具有非凡的能力,但也存在重大风险。当实时数据与训练数据不同时,模型可能会失效。例如,如果一个模型只接受了 "猫与狗 "的训练,但给它一张飞机的图片,它就不会给出好的结果。

这种分布失衡问题的更微妙版本是医疗保健领域的一个重要安全问题。还可能出现复杂的偏差,涉及基础数据的包容性、基于种族的不平等和不公平的诊断和治疗选择、算法设计选择以及其他问题。   

人工智能 3.0:基础模型和生成式人工智能

人工智能 2.0 有一个关键问题,与有点儿夸张的灾难性遗忘有关:在处理长文本序列时,它很难记住序列中较早的内容。2017 年出现的转换器架构帮助解决了这一问题,让模型在处理长段落时能够集中注意力。

随后几年,转换器与更多计算和更多数据相结合,创建了基础模型和大型语言模型。2022 年和 2023 年,进展速度急剧加快,标志着第三个时代的到来。

人工智能 2.0 区别于人工智能 3.0 的两个关键要素。首先,人工智能 2.0 是针对特定任务的。它一次只做一件事。如果个人希望它做其他事情,就需要一个新的数据集和训练一个新的模型。

其次,人工智能 2.0 在很大程度上是对事物进行预测或分类。它生成新单词、图像或其他内容的能力有限。

人工智能 3.0 则从根本上不同。它可以完成许多不同的任务,而无需重新训练。例如,一个简单的文本指令就能改变模型的行为。像 "为专家顾问写这张便条 "和 "为病人的母亲写这张便条 "这样的提示会产生明显不同的内容。

这些模型的能力也有显著提高:解释真正复杂的问题;接受并生成文本、图像和声音;创建与人写的几乎无异的回复;以及进行长时间对话。这些模型有多种类型,我们将重点讨论一个重要的类别--大型语言模型。

这些模型已经影响到我们的日常生活,如写作助手、图像生成器、软件编码助手和聊天机器人。针对健康领域的大型语言模型现在也已经存在。

例如,Med-PaLM 和 Med-PaLM 2 是谷歌开发的经过医学调整的基础模型,在医学执照考试类型的问题上达到了专家级水平。当医生将 Med-PaLM 2 的答案与不了解其来源的医生所写的答案进行比较时,在 9 个评估维度中的 8 个维度上,医生都强烈倾向于该模型的答案。想象一下,有一大堆文档。一个人按顺序向模型展示每个单词,但不让它看到下一个单词。

相反,要求模型一次又一次地预测单词。每当模型预测错误一次,它就会改变其内部关于单词如何组合在一起的表征。最终,它就会建立一个关于这些单词(以及概念)如何组合在一起的表征。之后,当该模型被问到一个问题时,它就会通过预测答案中可能出现的下一个单词来做出反应。

将这些模型的基本版本视为下一个单词预测引擎。这有助于理解它们的一些惊人行为。例如,这些模型可能擅长编写计算机程序,却不擅长算术。为什么呢?因为它们不是在做数学,而是在预测一个序列中的下一个单词。   

同样,它们可能会返回听起来合理但不正确的期刊引文。为什么?同样的原因:他们不是在PubMed上查资料,而是在预测似是而非的下一个词。

这些 "幻觉 "是人工智能 3.0 中的一个新风险类别。在这一领域,基础和检索增强生成等方面的技术进步正在积极提高性能,这些模型使用计算器等工具或实时访问网络的能力也提高了结果。

我们预计,人工智能 3.0 将作为增强工具投入使用,最初将帮助解决医疗保健方面的问题,如文档记录负担。随着这些工具随后开始支持临床实践,临床医生也将参与其中,因此需要一个深思熟虑的监管框架,以帮助确保患者安全地从这项技术中获益。

基础模型和生成型人工智能代表了人工智能能力的一场重大革命,为改善护理提供了巨大潜力。如今,医疗保健领导者正在就人工智能做出决定。虽然任何启发式方法都会省略细节并失去细微差别,但人工智能1.0、2.0和3.0的框架可能对决策者有帮助,因为每个时代都有根本不同的能力和风险。

编译整理自:Howell MD, Corrado GS, DeSalvo KB. Three Epochs of Artificial Intelligence in Health Care. JAMA. 2024 Jan 16;331(3):242-244. doi: 10.1001/jama.2023.25057.   仅供专业人士交流目的,不用于商业用途。
2024年2月19日


智慧医疗网 © 2022 版权所有   ICP备案号:沪ICP备17004559号-5