GPT-4在语言能力上的智商，已经吊打人类！

91百科网 2024年05月08日 16:09:46 37 0

最近，有位老外测试了GPT-4的智商，结果显示它的语言智商达到了152。

据调查，人类的平均智商为90-109。仅就语言智商而言，人类已经彻底被GPT-4打败了……

我们早已熟悉 GPT-4 的功能。 3月底，微软一篇长达154页的论文震惊了世界。

微软在论文中表示，GPT-4展现了通用人工智能的火花，可以认为是通用人工智能的早期版本。

论文地址：

通过测试，微软研究人员证实，GPT-4不仅精通语言，而且在数学、编程、视觉、医学、法律和心理学等多样化、困难的任务中也能表现出色，而无需特殊提示。

最可怕的是，在所有这些任务上，GPT-4 的表现都接近人类水平，并且常常超过以前的模型。

接下来我们就来看看GPT-4在各个方面的能力，哪些可以打败人类，哪些还赶不上我们。

为 GPT-4 量身定制的 IQ 测试

首先，这家伙在网上搜索免费的智商测试。

但他发现了一个棘手的问题：这些智商测试很多都是图像的形式。

不过，GPT-4目前可以认为是“盲人”+“聋人”，不具备读取图像的能力。

怎么做？年轻人这才意识到，必须有一种专门为视力障碍者设计的智商测试。

他尝试了一下并找到了。然而，这种测试非常昂贵，需要1500多美元，因此不能免费进行。

无需任何人的帮助就能过上舒适的生活。这个小家伙干脆停止了工作，开始自己动手，创建了一个为 GPT-4 量身定制的 IQ 测试版本。

打败陶哲轩难，更难打败GPT-4

首先考验的是GPT-4的数学能力。

世界上最受欢迎和顶级的数学测试是什么？自然是国际数学奥林匹克竞赛。

陶哲轩是世界上最伟大的数学家之一，1986年参加了国际数学奥林匹克竞赛。

那一年，他连考试第六题都答不出来。

可以使用GPT-4吗？

小哥这道题输给了GPT-4，结果是——做到了，但是不对。

因此，我们不能说它超越了世界上最强大的成人数学家。

另外，它也不能证明孪生素数猜想。（如果能证明的话，就会有鬼）

弟弟要求GPT-4画出方程的坐标，也被GPT-4拒绝。

我非常有礼貌地请求，但被拒绝了。

那么，GPT-4 的局限性是什么？

这家伙只能查公开文件。在 OpenAI 的官方论文中，GPT-4 在 SAT 数学测试中的得分高于 91% 的人类，并且在其他数学测试中也表现出色。

不善于沟通的语言天才

接下来我想测试一下GPT-4在人际智能和内省智能方面的表现如何。

严谨的小哥先上网查了一下什么是人际智能——善于处理人际关系的人，能够更好地理解他人、与他人互动。这些人善于评估周围人的情绪、动机、欲望和意图。

然后，他找到了一篇SAT考试的文章，复制了文章的内容，并将所有与角色动机相关的问题扔给了GPT-4。

GPT-4的性能还不错……？四个问题中有三个是正确的。

然而，GPT-4不具备任何分析情绪的能力。

因为，按照其自己的说法，它只是一个AI模型，并没有“自我”的概念。

GPT-4的内省智能怎么样？

弟弟说，内省智力高的人，对自己的长处和短处有清醒的认识。

将其作为提示输入到 GPT-4 中，发现这个模型的定位相当清晰。

例如，优势包括丰富的知识储备、快速响应、多语言能力、模式识别能力、可扩展性强等。

缺点包括缺乏个人经验、缺乏某些领域的知识、对语境、文学解读、道德判断等的理解较差。

但弟弟却表示，这个程度的了解还远远不够。总的来说，GPT-4的人际智能和内省智能一般。

小哥还给GPT-4做了语言智商测试，它得到了152分。

对于人类来说，这个分数意味着——你是一个天才。

空间推理测验

说到太空能力，GPT-4的表现并不乐观。

本来我想让GPT-4直接做一套空间推理的选择题。

GPT-4在语言能力上的智商，已经吊打人类！小哥智商魔方操作人际第1张

不过OpenAI未来会慢慢开发GPT-4的图像识别功能。

在 OpenAI 发布的视频中，研究人员上传了这样的图像，然后询问 GPT-4 如果绳子缩短会发生什么。

GPT-4说气球会飞走！

我哥哥用 GPT-4 玩井字棋，通过文本输入控制移动。

但GPT-4在深知规则后却作弊了。

弟弟本来应该赢，所以他请 GPT-4 帮他在底排中间画一个三圈。

GPT-4 更好，只需擦掉顶行中的圆圈并画出自己的十字即可。作弊才能获胜。

ChatGPT：魔方？我不能

为了进一步测试GPT-4的空间理解能力，小哥使用了杀手级武器——魔方。

要知道，对于人类来说，魔方也是衡量一个人空间感的方式之一。

首先，因为GPT-4无法读取图片，所以我们首先必须想办法用文字描述魔方的状态。

熟悉魔方的朋友应该对下图不陌生。在公式中，我们经常使用多个字母，或者字母加撇号，来表示不同的运算。

一般来说，魔方正对着我们，不同的旋转对应着不同的表情。就像下面这样。

小哥在视频中做了演示，确保GPT-4明白这个意思。

那么，是时候带着 GPT-4 出去散步了！看看会不会恢复。

总是从简单开始。我的第一步是将魔方的顶层向左扭转，看看 GPT-4 是否能恢复它。

这个难度对于GPT-4来说仍然不难。小哥输入U操作（将顶层向左转），GPT-4很快给出了答案U'（U的逆操作）。

接下来是UR，意思是顶层向左扭转一次，向右扭转一次。

GPT-4也很快提供了逆向操作——R'U'。

那么困难来了！小兄弟开始彻底搅乱魔方，一共十多步。

令人惊讶的是，GPT-4 居然生成了结果！

然而小哥仔细一看，发现GPT-4生成的恢复方法是将所有被打乱的步骤反转。

读完我无语了，这有什么用呢？

于是小弟发现这样做就会出现这个问题。由于输入扰码的方式，GPT-4 在恢复时必须反向操作。

问题的关键是我们不能让GPT-4知道它是如何被破坏的。

小兄弟很聪明，问GPT-4，如果是你，你会如何描述魔方的状态？

GPT-4采用如下方法：用不同的字母代替不同的颜色，用字母表达各个表面的颜色。

这样可以避免搞乱步骤。

这次尝试之后，只成功了第一次小试，也就是结果只被打乱了一次。

GPT-4在处理简单问题时确实很无情，但不幸的是，当它变得复杂时，它就变得迟钝了。

最终生成了下图所示的结果——

小兄弟说，这个真正的魔方不能扭成这样。你在做什么 GPT-4？？

这个结果直接宣判了GPT-4具备玩魔方的能力。

除了向后恢复之外，GPT-4根本无法解魔方。

两位总统RAP对决，泰裤火了

最后，这家伙还测试了GPT-4的音乐能力。

我们都知道GPT-4可以写诗。

在这种情况下，我要求 GPT-4 根据 Minecraft 服务器中特朗普和拜登之间的说唱大战的主题写说唱歌词和旋律，并制作一个节拍。

小弟发现最好的办法是使用ABC表示法，因为GPT-4不能写五线谱。

因此，我要求 GPT-4 使用 ABC 表示法编写 Boom bap 节拍，然后将节拍输入到音乐网站中。

GPT-4写的beat是这样的——

这听起来并不令人意外。

小兄弟想保存这个节拍，所以他换了另一种乐器。将其下载为 midi 文件并将其上传到 FL Studio。不好的一点是所有的乐器都合并到一个轨道中。

所以我要求 GPT-4 为每个轨道提供一个单独的乐器文件。

当成品发布时，相当惊艳：“哟！我是拜登，我是来打破纪录的，咱们开门见山吧……”

然后，我下载了一个现成的节拍，把它变成了拜登和特朗普之间的说唱大战——大家准备好尖叫吧。

总的来说，GPT-4已经在很多方面击败了人类。如果未来有一天能够克服视觉和听觉的缺陷，人类的未来还真的很难说。

参考：

标签：小哥智商魔方操作人际

本文地址： http://91mhw.com/613762.html

文章来源： 91百科网