文章主题:科技, 加拿大, ChatGPT

666AI工具大全,助力做AI时代先行者!

科技日报记者 刘霞

在本周六出版的《放射学》杂志上,一项由加拿大科学家主导的研究取得了重大突破。他们宣布,经过严格评估,最新版本的ChatGPT已经成功通过了美国放射学委员会的质量认证。这一成果无疑彰显了大型语言模型在医疗领域的巨大潜力,然而同时也揭示了一些潜在的问题。研究团队提醒,尽管ChatGPT能够提供许多准确的答案,但仍存在提供错误信息的风险,因此建议用户在使用其答案时,务必进行核实。

ChatGPT在美国放射学委员会考试中的表现及优势与局限性

图片来源:物理学家组织网

ChatGPT是一款由OpenAI研发的人工智能聊天机器人,其运作原理是基于深度学习模型,在大量的训练数据中发现词汇间的模式与联系。基于此,ChatGPT能够生成类似于人类的语言反应。如今,这种聊天机器人已经得到了广泛应用,甚至被谷歌、必应等知名搜索引擎所采纳,成为了医生和患者查询医疗信息的重要工具。然而,由于训练数据的质量并不总是可靠,因此ChatGPT有时可能会返回与实际情况不符的答案。

为深入评价ChatGPT在美国放射学委员会考试中的性能及其实用价值,多伦多大学的拉杰什·哈瓦那博士及其团队首先对其进行了基于GPT-3.5的适应性测试。本次测试共涵盖了150道题目,其风格、内容和难度均与加拿大皇家学院以及美国放射学委员会的考试相仿。值得注意的是,这些题目并未包含任何图像,主要分为两大类别:低阶思维问题,包括知识回顾和基本理解;以及高阶思维问题,涉及影像学表现描述、临床管理、计算和分类以及疾病关联等。

在一项针对自然语言处理模型的研究中,科学家们对两种不同的模型进行了比较,这两种模型分别是基于GPT-3.5的ChatGPT和GPT-4。研究发现,ChatGPT的准确率达到了令人满意的69%,几乎达到了及格线的70%。在处理低阶思维问题时,ChatGPT的表现尤为出色,其准确率甚至高达84%。然而,当面对高级思维问题时,ChatGPT的准确率就显得有些力不从心,只有60%的准确率。相比之下,GPT-4的表现则更为突出。它的准确率高达81%,而且在处理高阶思维问题时更是得心应手,准确率达到81%。然而,GPT-4在处理低阶思维问题时,准确率仅为80%,并且在这一部分题目中,GPT-4答对了所有的题目,没有犯错误。这样的表现引发了研究团队对GPT-4收集信息可靠性的质疑。

两项独立的研究均指出,ChatGPT存在提供错误答案的潜在风险。若仅依赖其来获取信息,将面临极大的安全风险。这是因为人们可能未能意识到ChatGPT提供的答案并不准确,这也是目前其面临的最大挑战。然而,在当前阶段,ChatGPT的最优应用场景是激发创意、协助撰写数据摘要,而在快速信息检索方面,则需对它所提供的 fact-based 答案进行核实。

(来源:科技日报)

更多精彩资讯请在应用市场下载“极目新闻”客户端,未经授权请勿转载,欢迎提供新闻线索,一经采纳即付报酬。24小时报料热线027-86777777。

ChatGPT在美国放射学委员会考试中的表现及优势与局限性

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号AIGC666aigc999或上边扫码,即可拥有个人AI助手!