新闻中心 > 热点聚焦  > 正文

网上问医断病,这轮AI行不行?

2023-07-18 09:10:24   来源:科技日报

5034

你在网上搜过“我哪哪疼是不是得了啥啥病”吗?答案可能不尽如人意。但随着ChatGPT等大型自然语言模型(LLM)风生水起,人们开始尝试用它来回答医学问题或医学知识。

不过,靠谱吗?

就其本身而言,人工智能(AI)给出的答案是准确的。但英国巴斯大学教授詹姆斯·达文波特指出了医学问题和实际行医之间的区别,他认为“行医并不只是回答医学问题,如果纯粹是回答医学问题,我们就不需要教学医院,医生也不需要在学术课程之后接受多年的培训了。”

鉴于种种疑惑,在《自然》杂志新近发表的一篇论文中,全球顶尖的人工智能专家们展示了一个基准,用于评估大型自然语言模型能多好地解决人们的医学问题。

现有的模型尚不完善

最新的这项评估,来自谷歌研究院和深度思维公司。专家们认为,人工智能模型在医学领域有许多潜力,包括知识检索和支持临床决策。但现有的模型尚不完善,例如可能会编造令人信服的医疗错误信息,或纳入偏见加剧健康不平等。因此才需要对其临床知识进行评估。

相关的评估此前并非没有。然而,过去通常依赖有限基准的自动化评估,例如个别医疗测试得分。这转化到真实世界中,可靠性和价值都有欠缺。

而且,当人们转向互联网获取医疗信息时,他们会遭遇“信息超载”,然后从10种可能的诊断中选择出最坏的一种,从而承受很多不必要的压力。

研究团队希望语言模型能提供简短的专家意见,不带偏见、表明其引用来源,并合理表达出不确定性。

5400亿参数的LLM表现如何

为评估LLM编码临床知识的能力,谷歌研究院的专家谢库菲·阿齐兹及其同事探讨了它们回答医学问题的能力。团队提出了一个基准,称为“MultiMedQA”:它结合了6个涵盖专业医疗、研究和消费者查询的现有问题回答数据集以及“HealthSearchQA”——这是一个新的数据集,包含3173个在线搜索的医学问题。

团队随后评估了PaLM(一个5400亿参数的LLM)及其变体Flan-PaLM。他们发现,在一些数据集中Flan-PaLM达到了最先进水平。在整合美国医师执照考试类问题的MedQA数据集中,Flan-PaLM超过此前最先进的LLM达17%。

不过,虽然Flan-PaLM的多选题成绩优良,进一步评估显示,它在回答消费者的医疗问题方面存在差距。

专精医学的LLM令人鼓舞

为解决这一问题,人工智能专家们使用一种称为设计指令微调的方式,进一步调试Flan-PaLM适应医学领域。同时,研究人员介绍了一个专精医学领域的LLM——Med-PaLM。

设计指令微调是让通用LLM适用新的专业领域的一种有效方法。产生的模型Med-PaLM在试行评估中表现令人鼓舞。例如,Flan-PaLM被一组医师评分与科学共识一致程度仅61.9%的长回答,Med-PaLM的回答评分为92.6%,相当于医师作出的回答(92.9%)。同样,Flan-PaLM有29.7%的回答被评为可能导致有害结果,Med-PaLM仅5.8%,相当于医师所作的回答(6.5%)。

研究团队提到,结果虽然很有前景,但有必要作进一步评估,特别是在涉及安全性、公平性和偏见方面。

换句话说,在LLM的临床应用可行之前,还有许多限制要克服。(记者 张梦然)

文章关键词:AI 责编:王丽萍
5034

相关阅读 换一换

  • 阴魂不散——AI视频起底北约军事霸权

      北大西洋公约组织(北约)峰会11日至12日在立陶宛首都维尔纽斯举行。   作为冷战时期集团对抗的产物,北约本应在1991年华约解散后随之终结,却因美国的霸权野心从一个地区防御性组织向全球侵略性条约转变。   而今的北约,不断扩张、四处“

  • 【何以中国】盛世中华有多美?AI给中国做了一组名片

    流光一瞬,华表千年,方寸之间,领略生生不息的中华文明。来看AI给中国做的名片 

  • 自助盖章、AI模拟面试 智慧科技让毕业生求职就业更顺畅

    眼下,2023届高校毕业生已经陆续离校,按照教育部要求,教育系统要为离校未就业毕业生提供“不断线”的就业服务,做到三个“不断线”,即岗位推送不断线、就业服务不断线、重点帮扶不断线。

  • WAIC开幕首日五大亮点齐发,合力打造全球顶尖人工智能盛会

    WAIC开幕首日五大亮点齐发,合力打造全球顶尖人工智能盛会澎湃新闻记者 俞凯2023-07-06 17:18来源:澎湃新闻 ∙ 浦江头条 >字号2023年7月6日,以“智联世界·生成未来”为主题的世界人工智能大会(WAIC 2023)

  • 特斯拉CEO埃隆·马斯克:中国一定能做好,会有很强的AI能力

    7月6日,特斯拉CEO埃隆·马斯克在2023世界人工智能大会上表示,中国一旦下定决定要做一件事情,就一定能做好,各个产业都是这样,包括人工智能,相信中国会有很强的人工智能能力。

  • 上半年A股人均赚3.9万,你赚了吗

    2022年底,A股的总市值84.88万亿;截止2023年6月30日收盘,A股总市值93.42万亿,增加了8.54万亿,股民数为2.18亿,人均盈利3.91万。下半年,一方面,宏观经济预期还没有根本性的扭转;另一方面,低迷的经济数据,又使得市场对于政策的预期升温,因为也只有政策,才有能力扭转市场预期。

  • “AI换脸”诈骗出现涉政苗头

    瞭望

  • 光山县招标投标领域创新上线AI智能公平竞争审查系统

    映象网讯(河南广电·大象新闻记者 李光远 通讯员 向宣垣 田丽英)为深入贯彻落实《国务院关于在市场体系建设中建立公平竞争审查制度的意见》,规范招标信息发布工作,进一步优化招投标领域营商环境,近日,光山县公共资源交易中心依托软件开发公司创新研

  • AI来了,“智能”抢了“人工”的饭碗?

    原本,很多人都以为,艺术领域是很难被AI侵蚀的,没想到却是最早遭受AI冲击的领域之一。

  • AI公益,开启全球“共益时代”

      光明网讯(记者 李飞 雷渺鑫)人工智能作为新一轮科技革命和产业革命的重要驱动力量,应用前景广阔,正日益成为推动社会公益事业发展的重要力量。人工智能与公益的结合,可以在弥合数字鸿沟,发展公平、包容的数字未来方面发挥重要作用。  6月26日

慢新闻

假的!“蒙华铁路断桥了”系不实信息 假的!“蒙华铁路断桥了”系不实信息

i新闻

新闻推荐

网站简介 | 版权声明 | 广告服务 | 联系方式 | 网站地图

Copyright © 2012 hnr.cn Corporation,All Rights Reserved

映象网络 版权所有