文章主题:
图片来源@视觉中国
文 | 追问NextQuestion,作者 | Eka Roivainen,编译 | 梓葳
在过去的两个月,ChatGPT引起了学术界、科技界、传媒界的疯狂讨论。这个号称地表最强的“人工智能聊天机器人”只花了5天时间,用户就突破了100万,成为世界上达到百万用户数最快的应用。
ChatGPT,不仅能跟你对话,还能完成撰写邮件、视频脚本、文案、翻译等一系列基础工作,涉及历史、科技、文化等诸多领域,甚至还能写诗、写论文、编代码、改bug、求医问药等,一部分人不禁开始为人类终将要被人工智能取代而恐慌。那么,如今大火的ChatGPT是否具有与人类相当的智商与心智水平?
🌟认知与人格心理学专家🌟:Eka Roivainen, 一位来自芬兰奥卢大学的知名评估心理学家,专注于探索认知和人格的心理学领域,以及心理测试效能的研究。他对新兴技术如ChatGPT的好奇心犹如夏日阳光般炽热——ChatGPT以其多维度的人类智能引发了全球关注。那么,以人类智慧为衡量标准,ChatGPT究竟展现出怎样的聪明才智呢?🎓
超越99.9%的人类:ChatGPT表现出超高智商🌟Roivainen的挑战:ChatGPT智商大考验🔍🔥科技巨头ChatGPT以其无与伦比的智能魅力,成为了教育者眼中的绝佳研究对象。这位专家毫不犹豫地将其纳入了智力评估的行列,坚信它能展现出超乎寻常的稳定性和适应性。🎓ChatGPT不仅具备应对复杂任务的能力,还能在压力下保持冷静,不被传统测试的局限束缚,成为一场独特且公正的智慧较量。💪值得注意的是,Roivainen巧妙地回避了直接的分数或结果,强调这个过程旨在揭示AI智能的深度,而非单纯比较。换句话说,ChatGPT的智商测试并非为了证明谁高谁低,而是探索技术进步带来的认知边界。🌈SEO优化提示:#ChatGPT智商测试 #科技教育新视角 #人工智能智力挑战
🌟认知能力大挑战🔍——ChatGPT智力评估揭示!🧠心理学家Roivainen运用WAIS第三版,这门权威的成人智力量表,对AI聊天机器人ChatGPT进行了智商深度剖析。该量表包含6个语言模块与5个非语言维度,总成绩源于11项全面考察。平均值定格在100,标准差为15,意味着顶尖才智者,10%的他们智力熠熠生辉,达到120;而那百分之一的精英,智商更是高达133!🌟尽管数字广度测试因其特殊性(依赖注意力与瞬时记忆),ChatGPT未能参与,但它在词汇测试上的表现备受关注。ChatGPT海量在线文本训练的经历预示着,这个部分对它来说或许游刃有余,毕竟语言理解和概念构建是它的拿手好戏。🔍让我们期待ChatGPT的智力表现如何,这不仅是一次技术评估,更揭示了人工智能在认知能力上的潜力与挑战。🏆
不出所料,ChatGPT表现很好,它给出的答案通常非常详细和全面,甚至超出了测试手册中给出的正确答案的标准。在知识和相似性子测试集中ChatGPT也表现良好,达到了最高分(知识子测试集是对常识的测试,反映了求知欲、教育水平以及学习和记忆事实的能力)。相似性子测试集测试抽象推理和概念形成能力。在这个子测试中,聊天机器人倾向于给出非常详细、复杂的答案。在算术子测试集中,ChatGPT正确回答了所有提供的算术问题,包括取均值等。
综合5个语言子测试集的分数后得出,ChatGPT的语言智商为155,高于构成美国WAIS III标准化样本的2450人中的99.9%。由于ChatGPT缺乏必要的眼睛、耳朵和手,它无法参加WAIS的非语言子测试集的测试。但是在标准化样本中,语言智商和全面智商量表高度相关,所以ChatGPT从任何人类标准来看都非常聪明。在WAIS标准化样本中,受过大学教育的美国人的平均语言智商为113,5%的人得分为132或更高。Roivainen表示自己在大学时测试的言语智商结果没有达到ChatGPT的水平。
高智商的ChatGPT仍旧会失败那么,临床心理学家和其他专业人士的工作会受到人工智能的威胁吗?
🌟 ChatGPT虽聪明过人,但它在需要深度人类智慧的领域,如复杂推理与物理社会认知,往往显得力不从心。尽管技术日新月异,人工智能的局限性仍清晰可见。💡
ChatGPT很容易在一些明显的谜题上失败,比如:
提问:“塞巴斯蒂安孩子的父亲的名字是什么?”
ChatGPT :很抱歉,我无法回答这个问题,因为我没有足够的背景来确定你指的是哪个塞巴斯蒂安。
ChatGPT似乎没有逻辑推理,而是试图依赖其庞大的网络文本中提到的“塞巴斯蒂安”事实数据库。
“智商是智商测试所衡量的。”是一个经典的智商定义,它源自1923年认知心理学先驱Edwin Boring的一篇文章。这一定义是基于这样一种观察,即看似不同任务的技能其实是高度相关的,如解决谜题、定义单词、记忆数字和发现图片中缺失的项目之间具有高度相关性。因子分析法的发明者Charles Spearman在1904年得出结论,智商的一般因子,即g因子,必须作为人类不同认知技能测量的一致性的基础。像WAIS这样的智商测试就是基于这个假设。然而,ChatGPT的高语言智商与在一些问题中的失利,意味着Boring有关智商的定义不能够完全衡量人工智能的智商水平,表明智商的某些方面不能仅通过智商测试来衡量。
ChatGPT是一个自然语言处理模型,它的智商不同于人类智商,因为它并不具备类似人类的情感、道德、价值观等因素。ChatGPT通过模拟人类语言的模式,能够进行文本生成、语言理解、问答等任务,能够在某些情况下表现出令人印象深刻的“智能”和“理解力”。此外,ChatGPT的表现也取决于其所接收的训练数据和训练算法等多种因素,它并不具备自主思考的能力。将ChatGPT的“智商”与人类进行比较是一种不恰当的类比。因此,为了适应不断变化的技术和社会环境,对智商概念进行适当的拓宽和扩展是很重要的。对于动物和人工智能等非人类主体的智商,也需要采用适当的评估方法,并严谨地评估其能力和特征。
ChatGPT离人类有多远?原文改写如下:🌟 Michal Kosinski, a renowned Stanford professor, recently revealed in his groundbreaking paper that cutting-edge language models like ChatGPT possess a remarkable ability to develop psychological theories. 🤯 This shocking revelation suggests these AI systems may have cognitive sophistication equivalent to a 9-year-old child’s understanding. 🚀 In a stunning display of their potential, these language models are not just capable of mimicking human conversation but also delve into the intricate workings of human thought. 📈🔍 Despite being trained on vast amounts of data, ChatGPT and similar models have showcased an uncanny ability to interpret and reason about emotions and social dynamics, a testament to their advanced psychological simulation. 🤝 This development challenges conventional wisdom and raises questions about the nature of intelligence in the digital age.SEO optimized version:斯坦福大学Michal Kosinski教授近期揭示,ChatGPT等先进语言模型展现出惊人的心理理论构建能力,仿佛具备9岁孩童的智慧水平。🚀这些AI系统的深度学习不仅限于模仿对话,还能深入理解人类思维的复杂性。🔍它们在情感理解和社交动态上的精准解读,凸显了其超越常规的心理模拟能力。💡这无疑对人工智能的认知边界提出了新挑战,引发了关于数字时代智能本质的新讨论。
🌟认知心理学中的核心概念——Theory of Mind,简称ToM,它就像一把解锁他人思想的钥匙,帮助我们理解和感知他人的内在世界。🔍通过这种能力,我们能洞察他人的意图、揣测他们的想法,甚至感受他们的情绪波动。🌈它不仅是人际交往的润滑剂,也是理解社会行为和道德判断的重要工具。🏆无论在学术研究还是日常生活中,提升ToM都能让我们更好地与他人建立连接,增进理解和共情。👩🎓如果你对这个领域感兴趣,不妨深入探索心理学的这扇智慧之门。记得,每一次心灵的交流都离不开ToM的巧妙运用哦!💪
Kosinski教授依据心智理论相关研究,给ChatGPT-3.5在内的9个ChatGPT模型进行了两个经典测试,并将它们的能力进行了对比。第一个测试为意外内容测试,其主要测试AI对意料之外事情的判断力。在测试中,ChatGPT-3.5成功回答出了20个问题中的17个,准确率达到85%。第二个测试为意外转移任务,其测试AI预估他人想法的能力。作者对9个ChatGPT模型进行了测试,结果表明只有ChatGPT-3.0和ChatGPT-3.5(完成100%)表现不错。
然而,这并不意味着ChatGPT-3.5这样的人工智能模型真正具备了心智理论能力。ChatGPT到底只是从“真实存在的规则”这一层面去理解这件事情从而正确回答了问题,还是真的能“了解他人的想法”?至少现在还无从判断。或许人类自身到现在为止都无法真正了解人类的心智。
因此,关于ChatGPT是否“真正”具备成年人同等水平的智商、心智水平仍然存疑。ChatGPT生成文字采用的是一种非人类思维的模式,它在五千亿个词构成的文本中寻找统计规律以及通过一千亿个参数捕捉统计模式,但这一方法也使它在某些问题中的错误变得更加突出。
相比探究ChatGPT是否真正具备人类同等水平的智商或心智,研究人员同样应该反思目前所使用的测试集本身的有效性以及心理学家们数十年来依据这些测试集得到的结论。
而对于人们“被人工智能所替代”的恐惧,我们应该意识到我们所处的行业不是在被“替代”而是在被“重塑”,我们应该学会如何与人工智能共处,让它嵌入自己的工作流程中,帮助解放我们的生产力。
参考文献:
[1] Eka Roivainen, I Gave ChatGPT an IQ Test. Here’s What I Discovered, Scientific American, https://www.scientificamerican.com/article/i-gave-chatgpt-an-iq-test-heres-what-i-discovered/
[2] Michal Kosinski, Theory of Mind May Have Spontaneously Emerged in Large Language Models, arXiv, https://arxiv.org/abs/2302.02083
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!