AI与人类思考方式的差异：从ChatGPT到乌鸦

文章主题：人工智能, ChatGPT, 思维方式, 语言模型

公众号规则是部分推送，您只有设了星标，才能及时接收最新推送从鹦鹉，到乌鸦

1/6

人工智能不只是 ChatGPT

在上周末的”思想钢印”公众号上，我们发布了一篇探讨特定思维方式的文章。本文将延续前半部分的內容，同时为您呈现新的观点和新撰寫的後半部分，主題围绕著我們在這篇文章中關注的思維模式。透過深入探討這個思維模式，我們希望能夠為讀者提供更多有價值的思考角度。

在 ChatGPT 风靡全球之后，一个有趣的段子广为流传：过去，我们设想的人工智能，是创作诗歌、绘画和音乐方面的助手；然而，出乎意料的是，最终成为主导的却是人工智能在文学、艺术和音乐领域的创作，而我们自己在厨房中烹饪、洗涤和维修电脑方面却逐渐变得无助。这个变化，无疑对我们提出了新的挑战和思考。

白领危机四伏，蓝领暗自庆幸。

然而，ChatGPT 实际上只是人工智能历史上的第一个爆款应用，又是以一对一对话形式展开，效果又超出了我们的心理预期，很容易让我们产生一个 ” 人工智能能说会道 ” 的错觉，进而让我们觉得，它未来可以取代很多白领的工作。

其实，ChatGPT 底层的自然语言大模型 GPT，只是众多人工智能大模型中率先 ” 涌现 ” 的一个，它更倾向于生成文本的能力，所以看起来都是写写文章，说说话，画画画，但并不是说人工智能就只能干这些，你总不能因为赵本山演小品，就以为东北人只会演小品吧？

所以说，哪有什么 ” 只取代白领的工作 ” 这么简单的事啊，取代蓝领工作的人工智能早晚也会来的。

仅就自然语言大模型而言，最有名的有两种方向，除了 GPT 模型外，还有 Google 的 BERT 模型，两者的核心区别在于目标不同，GPT 更倾向于生成文本，而 BERT 模型更倾向于理解文本，更不用说还有更多开发中的各种方向的人工智能模型。

这个区别可能人类无法理解，不理解文本怎么生成文本呢？

但这个问题对 AI 来说，并不存在。

本文就从这个话题开始，聊一聊 ChatGPT 跟人类的 ” 思考方式 ” 有什么不同。

2/6

文科的 GPT 和全科的 BERT

在不理解的基础上，如何生成内容？大家可以参考一部励志日本电影《垫底辣妹》。

这部电影描述了一个学业成绩不佳的学生，在一年内通过努力复习，成功考入我国顶级学府的故事。这位学生的成绩在全体学生中排名倒数第一，然而经过不懈的努力，他的成绩有了显著提高，最终进入了全国前2%的优秀学生行列，实现了令人瞩目的跨越式成长。

这个神奇的故事之所以能实现，是因为她只要考 ” 英语、小论文、历史 ” 这三门强调记忆的科目，她不需要很深的理解，只需要记忆和 ” 生成 “，注意重点是——不考数学、物理等注重推理的科目。

而 GPT 模型的成功，就像 ” 垫底辣妹 ” 一样，很大程度在于选择了 ” 语言生成 ” 为目标的捷径，从而让它看上去的效果比它实际上的突破更明显——这一点跟现实中一样，一个能说会道的员工，总是比只会干实事的员工，看起来更能干。

GPT 模型就像文科毕业生，由于其在生成文本方面的强大能力，毕业后最大的 ” 就业去向 ” 是自动生成文章类的 ” 工作 “、包括新闻、广告文案、创意内容、法律文书、文秘、各类咨询，等等；其次的 ” 就业去向 ” 是作为聊天机器人、虚拟助手、智能客服，等等，进行更加自然、流利的对话。

相比而言，BERT 模型虽然也是一个文科生，但也要学习数学、物理这一类注重推理的课程，全面发展。BERT 模型需要 ” 理解 ” 文本的内容，GPT 模型则不一定。

GPT 和 BERT 是两种不同的语言模型,它们的训练目标和实现方式有所不同。GPT 的训练目标是通过最大化下一个单词的条件概率来预测下一个单词,从而完成生成任务。这种方法使得 GPT 能够生成连贯、有意义的文本,并且在生成过程中能够利用上下文信息进行预测。BERT 的训练目标则是随机掩盖一些输入词汇并要求模型预测这些词汇,强迫模型预测缺失的单词,因此它的理解是到词汇这个级别的。这种方法使得 BERT 能够更好地理解句子结构,并且在与人类交互时表现更好。虽然这两种方法在实现上有所不同,但它们都是为了提高语言模型的表现而设计的。

原始文本存在一定的误解风险，尤其是由GPT生成的文本。尽管人们对于GPT的神奇之处已经有所认识，但在大规模应用中，它在非生成内容领域的表现仍存在不足。

作为一名文章写作高手，我将按照您的要求对原文进行改写。以下是我改写后的版本：例如，当您向AI助手提出请求时，您可以这样表达：“您好，AI助手，请帮我预订一家位于陆家嘴附近的粤菜餐厅，人均消费大约在500元左右，预定时间为明天晚上。”

对于这个句子，GPT 模型的 ” 理解 ” 是从过去的语料训练中，判断 ” 陆家嘴、粤菜、明天晚上、人均消费、500 元 ” 这些词的组合而不是词本身的意义，由此来判断自己应该输出什么样的内容，它对于语言的最小理解单位是句子，而不是词汇，会导致 ” 模型产生幻觉，编造训练中从未有过的数据 “。所以我们有时看到 GPT 推荐必胜客等成都小吃的离谱结果，因为它并不理解 ” 必胜客 ” 的属性，它还会把数学计算中的 1995 当成年代。

在GPT-4中，我们已经看到了一些显著的改进，但我们必须认识到，由于其基础模型仍类似于一个“文科生”，因此在处理更复杂问题时，出错的可能性依然存在。这种情况下，我们可能会陷入一种尴尬的境地，即经常与粤菜馆一同出现的咖啡馆。

由此看来，GPT 模式不会是终点，AI 代替人类的工作，文本类只是一个 ” 开胃菜 “。

GPT-5即将面世，人们不禁要问，随着GPT模型进化速度的加快，它能否真正理解和模拟人类语言呢？

这就要涉及到，到底我们应该如何定义 ” 理解 “？人类又是如何 ” 理解 ” 的？

3/6

相关文章