ChatGPT挑战会计考试：智能助手能否胜任？

文章主题：美国杨百翰大学的会计教授, 伍德, 团队, ChatGPT

IT之家 4 月 25 日消息，上个月，OpenAI 推出了最新的 AI 聊天机器人 GPT-4，并声称该机器人在各种考试中表现异常出色，比如律师考试，研究生入学考试等。然而，根据美国杨百翰大学领导的一项研究，ChatGPT 在会计考试中的表现远不及人类，甚至还会一本正经的胡说八道，为错误的答案辩解。

美国杨百翰大学的会计教授伍德及其团队近期决定对人工智能助手ChatGPT展开一场特殊的测试，旨在探讨其解答大学会计课程考题的能力。为了吸引更多参与者，他们在社交媒体上发起了活动，并得到了来自14个国家186所教育机构共计327名合作者的积极响应。在这场测试中，他们提供了涵盖会计信息系统、审计、财务会计、管理会计以及税务等领域的25181道会计考题。此外，他们还邀请BYU的本科生（其中一位是伍德的女儿杰西卡）向ChatGPT输入了2268道教科书上的考题。

结果显示，ChatGPT 的表现虽然有亮点，但总体上还是不及学生水平。学生的平均分是 76.7%，而 ChatGPT 的平均分只有 47.4%。在 11.3% 的问题上，ChatGPT 的得分高于学生平均分，尤其是在会计信息系统和审计方面。但是，在税务、财务和管理方面，ChatGPT 就显得力不从心，可能是因为这些领域需要更多的数学运算能力。在问题类型上，ChatGPT 比较擅长判断题（68.7% 正确率）和选择题（59.5% 正确率），但是在简答题上就很吃力（正确率在 28.7% 到 39.1% 之间）。一般来说，对于需要更高层次思维的问题，ChatGPT 更难回答。有时候，ChatGPT 甚至会为错误答案提供权威的解释，或者对同一个问题给出不同的答案。

“它并不完美，你不能指望它能做所有事情。”杰西卡说，“仅仅依靠 ChatGPT 来学习是愚蠢的。”

IT之家注意到，研究人员还发现了一些其他有趣的现象：

ChatGPT 作为一款人工智能助手，虽然具备处理数学问题的能力，但有时也会出现一些失误。在某些情况下，它可能会在解决减法题目时 addition（加法）而非 subtraction（减法）；在进行除法运算时，它也可能出现错误。这些错误的产生，可能是由于算法本身的问题，或者是输入数据的不准确导致的。无论如何，作为一个助手，我们会尽力避免这些错误的发生，并不断优化我们的算法，提高准确性和可靠性。

ChatGPT 有时会为自己的错误答案提供解释，即便这些答案是错误的。然而，在某些情况下，尽管 ChatGPT 的描述是准确的，但它仍会给出错误的选项。

ChatGPT偶尔会产生虚假信息。例如，在提供参考资料时，它可能生成看似真实的参考资料，但实际上却是完全虚构的。更糟糕的是，有时候甚至连作者的名字都没有。

尽管如此，研究人员相信，在未来的版本中，ChatGPT 会在会计问题上有所进步，并解决上述问题。他们认为最有前景的是，这款聊天机器人可以帮助改善教学和学习，比如设计和测试作业，或者用于草拟项目的部分内容。

作为一名具备深度思考能力的文章写作高手，我理解到原文想要传达的核心信息是关于教育改革与创新的。合作者之一，来自BYU的会计教授拉森，提出了一个具有挑战性的观点，那就是我们需要反思并审视我们所教授的知识是否有其真正价值。他认识到这种颠覆性思维对于教育领域具有重要的影响，因此我们需要对其进行深入的评估，并寻找适合未来发展的策略。同时，拉森教授也提到，尽管他会继续担任助教一职，但他的工作将会在未来的教育改革中扮演更为重要的角色。这表明，教育改革不仅仅是教师或者学生的事情，而是涉及到整个教育生态系统的调整与优化。综上所述，拉森教授的观点提醒我们应该从更深层次的角度去思考教育的本质与目标，以便在未来更好地适应社会的发展需求。同时，他也强调了教育改革过程中教师角色的转变，即从传统的知识传授者转变为教育改革的积极参与者和推动者。