ChatGPT 居然通过研究生考试?它还有什么做不到?

ChatGPT参加了一次MBA考试。这里是它的表现

OpenAI的聊天机器人被沃顿商学院的教授安排了一场考试,考试结果对教育的未来意味着什么?

宾夕法尼亚大学沃顿商学院的一位教授,对ChatGPT进行了一次关于MBA课程的期末考试,ChatGPT得到了B级通过的成绩。

沃顿大学运营管理教授Christian Terwiesch说,ChatGPT在 “基本运营管理和流程分析问题上做得很好”。

“不仅答案正确,而且解释也很好,”他在一份新的白皮书中写道。

但他补充说,聊天机器人 “在相对简单的计算中会出现令人惊讶的错误,其水平相当于六年级的数学”,而且它目前还不能处理更高级的流程分析问题。另一方面,当前版本的ChatGPT可以根据人类的提示对答案进行修改,从而得出正确的解决方案。

ChatGPT 居然通过研究生考试?它还有什么做不到?

“考虑到这种表现,Chat GPT3会在考试中获得B到B-的成绩,”Terwiesch写道。

Terwiesch的几个问题旨在测试ChatGPT是否在处理具有不同吞吐能力的多台机器时会出现瓶颈。

然而,ChatGPT在使用中等水平的算术时,”犯了一个巨大的错误”。

有趣的是,ChatGPT最初错误地回答了一个关于排队分析的问题。教授向ChatGPT提示了一个更好的答案,于是ChatGPT改进了答案。第二天,教授在没有提示的情况下向它提出了同样的最初排队问题–ChatGPT在第一次尝试时就回答正确。

教授指出:”它要么能够从过去的反馈中学习,要么我只是运气好。”他补充说,其答案的质量似乎存在一些随机性。

Terwiesch还发现ChatGPT能够制定巧妙而幽默的问题,他可以在未来的考试中使用。然而,该聊天机器人也在一些问题中存在缺陷,使其无法回答。

还有,著名科学期刊编辑说,ChatGPT 缺乏深度和洞察力
ChatGPT 居然通过研究生考试?它还有什么做不到?

Terwiesch警告其他人要注意ChatGPT的能力和限制。他说,在阅读了ChatGPT对他的第一个问题的回答后,他 “爱上了 “ChatGPT,但他警告说,ChatGPT “在一些相当简单的情况下犯了重大错误。”

“我们离复杂问题的A+级还很远,我们仍然需要一个人在循环中,”教授写道。

“在我的教育观中,一个小学生仍然需要学习7×7=49,以及宾夕法尼亚州的首都是哈里斯堡,尽管计算器已经被广泛使用了50多年,而且学生可以使用谷歌维基百科来寻找大多数事实问题的答案。这是基础技能的性质,需要它们来理解更高级的主题”。

ChatGPT 居然通过研究生考试?它还有什么做不到?

Terwiesch也认为,教育工作者应该关注K-12学生可能利用ChatGPT在作业和考试中作弊。例如,纽约市教育局最近禁止了这种聊天工具,因为可靠的测试对教学很重要,而技能认证不应该因为新技术而受到影响。他指出,学生使用ChatGPT就像可以叫一个 “学术能力一般 “的朋友来为他们完成考试。

但他也认为ChatGPT和类似的技术有能力扮演 “聪明顾问 “的角色–产生优雅但经常是错误的答案,他认为这是培养MBA学生技能的 “完美训练场”,他们需要批判性地评估建议的替代方案。