ChatGPT挑战会计考试：智能助手能否应对大学课程？

文章主题：美国杨百翰大学的会计教授, 伍德, 团队, ChatGPT

IT之家 4 月 25 日消息，上个月，OpenAI 推出了最新的 AI 聊天机器人 GPT-4，并声称该机器人在各种考试中表现异常出色，比如律师考试，研究生入学考试等。然而，根据美国杨百翰大学领导的一项研究，ChatGPT 在会计考试中的表现远不及人类，甚至还会一本正经的胡说八道，为错误的答案辩解。

美国杨百翰大学的会计教授伍德及其团队近期决定对人工智能助手ChatGPT展开一场测试，旨在探讨其是否具备解答大学会计课程难题的能力。这一举措在社交媒体上引发了广泛关注，吸引了来自14个国家186所教育机构的三位一体，共计327名合作伙伴参与其中。在这场测试中，他们共同贡献了25181道会计考试题目，覆盖了会计信息系统、审计、财务会计、管理会计以及税务等多个领域。此外，他们还邀请BYU的本科生（含伍德的女儿杰西卡）向ChatGPT提交了2268道教科书上的考题。

结果显示，ChatGPT 的表现虽然有亮点，但总体上还是不及学生水平。学生的平均分是 76.7%，而 ChatGPT 的平均分只有 47.4%。在 11.3% 的问题上，ChatGPT 的得分高于学生平均分，尤其是在会计信息系统和审计方面。但是，在税务、财务和管理方面，ChatGPT 就显得力不从心，可能是因为这些领域需要更多的数学运算能力。在问题类型上，ChatGPT 比较擅长判断题（68.7% 正确率）和选择题（59.5% 正确率），但是在简答题上就很吃力（正确率在 28.7% 到 39.1% 之间）。一般来说，对于需要更高层次思维的问题，ChatGPT 更难回答。有时候，ChatGPT 甚至会为错误答案提供权威的解释，或者对同一个问题给出不同的答案。

“它并不完美，你不能指望它能做所有事情。”杰西卡说，“仅仅依靠 ChatGPT 来学习是愚蠢的。”

IT之家注意到，研究人员还发现了一些其他有趣的现象：

ChatGPT 作为一个人工智能语言模型,虽然具备处理数学问题的能力,但有时也会出现一些错误。这些错误可能是由于模型学习过程中出现的偏差或是由于模型在某些情况下无法正确理解问题导致。例如,在解决减法问题时,模型可能会将两个数相加而不是相减,或者在执行除法运算时出现错误。这些错误的发生是由于模型的训练数据中存在不准确或不完整的信息,或者是由于模型在某些情况下无法理解问题的含义。因此,在使用 ChatGPT 进行数学计算时,需要注意其可能出现的错误,并尽可能提供准确的输入信息以减少错误的发生。

ChatGPT 有时会为自己的错误答案提供解释，即便这些答案是错误的。然而，在某些情况下，尽管 ChatGPT 的描述是准确的，但它仍会给出错误的选项。

ChatGPT偶尔会产生虚假信息。例如，在提供参考资料时，它可能生成看似真实的参考资料，但实际上却是完全虚构的。更糟糕的是，有时候甚至连作者的名字都没有。

尽管如此，研究人员相信，在未来的版本中，ChatGPT 会在会计问题上有所进步，并解决上述问题。他们认为最有前景的是，这款聊天机器人可以帮助改善教学和学习，比如设计和测试作业，或者用于草拟项目的部分内容。

作为一名具有高度专业素养的文章写作高手，我会以全新的视角对原文进行改写。拉森教授，一位来自BYU的会计学专家，在面对这次研究时，提出了一个值得深思的问题：“这为我们提供了一个反思的契机，让我们审视我们所传授的知识是否有其真正的价值。”他进一步指出，“这无疑是一次颠覆性的思考，我们需要对其后的行动方案进行全面评估。”尽管拉森教授仍将担任助手，但他所承担的工作职责将有所改变。