文章主题:ChatGPT, GPT-4, 人工智能, 聊天机器人

666AI工具大全,助力做AI时代先行者!

【CNMO新闻】ChatGPT,一个由OpenAI开发的人工智能聊天机器人程序,近期在全球范围内引起了广泛关注。仅用了两个月的时间,ChatGPT的活跃用户数量便已突破1亿大关,其火爆程度可见一斑。今年3月,OpenAI正式推出了他们最新的大型语言模型GPT-4。而令人颇感意外的是,仅在5月18日,CNMO就注意到,加拿大的科学家们在最近出版的《放射学》杂志上发表了一篇题为“ChatGPT在北美放射学会考试中取得优异成绩”的新论文

ChatGPT

据相关报道,为了对ChatGPT在美国放射学委员会考试中的性能进行评估,并深入探讨其优点与不足,多伦多大学的研究人员首先对其基于GPT-3.5的版本进行了测试。具体而言,研究团队采用了150道题目,这些题目的风格、内容以及难度都与加拿大皇家学院和美国放射学委员会的考试相仿。

在针对基于GPT-3.5的ChatGPT的研究中,研究者们得出了一个令人瞩目的结果:该模型的准确率达到了69%,几乎达到了及格线的70%。值得注意的是,它在处理低阶思维问题时表现尤为出色,成功率高达84%,然而在应对高级思维问题时,其正确率则略显不足,仅有60%左右。

在对比GPT-4和GPT-3.5时,我们发现GPT-4在性能上具有更优秀的表现,其准确率达到了81%,而在面对高阶思维问题时同样具有81%的准确率。然而,值得关注的是,GPT-4在处理低阶思维问题时准确率仅为80%,且在12道题目中出现了错误,相比之下,GPT-3.5却能全部回答正确。这一差异引发了研究团队对GPT-4信息收集可靠性的质疑。

ChatGPT模型的认知与局限性分析

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号AIGC666aigc999或上边扫码,即可拥有个人AI助手!