文章主题:医学问题, 人工智能回答, 医疗保健专业人员评估, 评估结果
财联社4月29日讯(编辑 赵昊)最新公布的一项研究表明,聊天机器人ChatGPT在某些方面能表现得比医生出色。
这项研究周五(4月28日)发表在国际著名医学期刊《JAMA Internal Medicine》上。结果表明:人工智能助手可能有能力帮助医生起草对患者问题的回答。
作者加州大学圣地亚哥分校约翰·W·艾尔斯(John W. Ayers)博士称,聊天机器人对患者的回应要普遍优于医生的回应,并且在回答质量和同理心方面的评分都明显高得多,“用人工智能改善医疗保健的机会是巨大的。”
在深入探讨之前,我们必须回顾一下研究团队的步骤。他们首先从社交平台上选取了195个医学问题,这些问题都曾经被人类医生解答过。然后,将这些医学问题输入到ChatGPT系统中,系统自动生成了与这些问题相关的AI回答。
然后,团队将人类医生的回答和聊天机器人的回答交由三名医疗保健专业人员来评估。
这组专业人员需要在三个方面打分:一、哪个反应得更好?二、信息的质量如何?三、回答是否具备同理心?
在评估过程中,医疗保健专业人员并不知道哪一份回答是来自人类的,或是来自ChatGPT的。
结果显示:在第一个问题上,评估者认为,聊天机器人在78.6%的问题上表现得比人类医生好;
在质量上,评估者觉得聊天机器人78.5%的回答表现良好或非常好,而人类医生只有22.1%;
在同理心方面,聊天机器人45.1%的回答被评为有同理心或非常有同理心,而医生的比例只有4.6%。
在研究中,我们发现了一个极具代表性的案例。一位网友在论坛上提问:使用漂白剂是否会有导致视力受损甚至失明的风险?对此,ChatGPT首先表现出关心,然后针对“不会失明”的答案,提出了一系列建议和激励措施。
在面对类似问题时,人类医生通常会采取不同的策略。他们倾向于给予患者积极的反馈,并告知其相关就医渠道。例如,当患者表示身体不适时,医生们往往会告诉患者:“你看起来没有太大的问题。”此类话语无疑能够给患者带来安慰。然而,在某些情况下,人类医生的回答可能并不十分准确。相比之下,三位医疗保健专业人士更青睐于ChatGPT的应对方式。这表明,人工智能助手在某些方面具有明显的优势,能够提供更精准、更有用的建议。
但有专家指出,ChatGPT的回复通常要比医生长得多,可能会影响质量和同理心的分数。爱丁堡大学自然语言处理教授Mirella Lapata称,如果不控制回答的长度,就很难确定评分者的判断标准。
本周另有一项研究表明,ChatGPT在一些特定的医学场合具有独特的价值和优势。研究人员要求ChatGPT提供五年级阅读水平的医嘱,“ChatGPT提供的答案写得很好、很详细,有望让待诊患者更早获得专业信息。”
不过,宾夕法尼亚大学医学教授David Asch博士强调,ChatGPT应该被视为对医生的补充。他还警告,人工智能工具还没有充分准备好,“我担心错误信息会被放大。”
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号AIGC666aigc999或上边扫码,即可拥有个人AI助手!