ChatGPT会计大挑战：能胜任大学考题吗？错误与反思并存

文章主题：ChatGPT, 大学会计课程, 考题测试, 会计信息系统

IT之家 4 月 25 日消息，上个月，OpenAI 推出了最新的 AI 聊天机器人 GPT-4，并声称该机器人在各种考试中表现异常出色，比如律师考试，研究生入学考试等。然而，根据美国杨百翰大学领导的一项研究，ChatGPT 在会计考试中的表现远不及人类，甚至还会一本正经的胡说八道，为错误的答案辩解。

🎓👨‍🏫伍德教授的会计研究团队对ChatGPT进行了深度评估，旨在验证其在大学会计课程中的知识水平。他们发起了一项国际性的挑战，吸引了14个国家的186所教育机构的327位热情参与者，涵盖了会计信息系统、审计、财务会计、管理会计和税务等多个关键领域。总计，他们精心准备了25,181道实战试题，确保测试的全面性和准确性。同时，他们也邀请BYU的学生，包括伍德教授的女儿杰西卡，用教科书上的习题来考验ChatGPT的能力，总数达到2,268题。这项严谨的学术实验旨在揭示AI在教育领域的潜力和可能的应用，同时也为学生的学习提供了有趣且有价值的对比参考。📚💻

结果显示，ChatGPT 的表现虽然有亮点，但总体上还是不及学生水平。学生的平均分是 76.7%，而 ChatGPT 的平均分只有 47.4%。在 11.3% 的问题上，ChatGPT 的得分高于学生平均分，尤其是在会计信息系统和审计方面。但是，在税务、财务和管理方面，ChatGPT 就显得力不从心，可能是因为这些领域需要更多的数学运算能力。在问题类型上，ChatGPT 比较擅长判断题（68.7% 正确率）和选择题（59.5% 正确率），但是在简答题上就很吃力（正确率在 28.7% 到 39.1% 之间）。一般来说，对于需要更高层次思维的问题，ChatGPT 更难回答。有时候，ChatGPT 甚至会为错误答案提供权威的解释，或者对同一个问题给出不同的答案。

“它并不完美，你不能指望它能做所有事情。”杰西卡说，“仅仅依靠 ChatGPT 来学习是愚蠢的。”

IT之家注意到，研究人员还发现了一些其他有趣的现象：

🎓当面对复杂的数学问题时，ChatGPT偶尔会让人忍俊不禁，它可能会不小心在减法中多加了两位数字，抑或在除法运算上犯下致命的错误。这类看似初级的数学误解，实则揭示出其在处理精确计算时的微妙挑战。虽然它的智能令人惊叹，但偶尔的小差错也提醒我们，技术并非万能，精准和细心仍是关键。

🌟ChatGPT虽智能🔥，但偶尔会陷入困惑迷雾。它能给出解答，却非总正确，有时甚至自相矛盾。尽管它的描述可能精确，但却可能导致选错路径。💡然而，这恰恰提醒我们，评估时需审慎多角度，切勿盲目依赖单一工具。毕竟，真理往往藏在深思熟虑之后。🤔

🌟警惕！ChatGPT并非无懈可击，有时会玩虚张声势的“学术”把戏。👀当提及参考资料时，它可能会抛出看似确凿的文献链接，实则为凭空捏造的伪文献，甚至冒充不存在的作者姓名，让人真假难辨。🔍这不仅欺骗了用户，也可能对依赖其信息的研究造成误导。要想避免掉入“假文献”的陷阱，保持警惕是关键！📚维护学术诚信，从拒绝虚假引用开始。

尽管如此，研究人员相信，在未来的版本中，ChatGPT 会在会计问题上有所进步，并解决上述问题。他们认为最有前景的是，这款聊天机器人可以帮助改善教学和学习，比如设计和测试作业，或者用于草拟项目的部分内容。

在这个关键时刻，让我们深入审视教育的本质——传授何为价值之所在。正如BYU会计学界的资深导师，研究合作人之一的拉森教授所指出的那样，这是一场深刻的革新挑战，我们需要重新定义未来的角色与职责。诚然，助教的工作内容将发生转变，但这不仅仅是一个简单的调整，而是一种教育理念上的深刻转型。让我们期待这个过程中，智慧的火花照亮教育之路，让每一个环节都充满意义和价值。🌟📚

这项研究发表在《会计教育问题》杂志上。

举报/反馈

AI时代，掌握AI大模型第一手资讯！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

扫码右边公众号，驾驭AI生产力！

相关文章