GPT-4在语言能力上的智商,已经吊打人类!

91百科网 32 0

最近,有位老外测试了GPT-4的智商,结果显示它的语言智商达到了152。

据调查,人类的平均智商为90-109。 仅就语言智商而言,人类已经彻底被GPT-4打败了……

我们早已熟悉 GPT-4 的功能。 3月底,微软一篇长达154页的论文震惊了世界。

微软在论文中表示,GPT-4展现了通用人工智能的火花,可以认为是通用人工智能的早期版本。

论文地址:

通过测试,微软研究人员证实,GPT-4不仅精通语言,而且在数学、编程、视觉、医学、法律和心理学等多样化、困难的任务中也能表现出色,而无需特殊提示。

最可怕的是,在所有这些任务上,GPT-4 的表现都接近人类水平,并且常常超过以前的模型。

接下来我们就来看看GPT-4在各个方面的能力,哪些可以打败人类,哪些还赶不上我们。

为 GPT-4 量身定制的 IQ 测试

首先,这家伙在网上搜索免费的智商测试。

但他发现了一个棘手的问题:这些智商测试很多都是图像的形式。

不过,GPT-4目前可以认为是“盲人”+“聋人”,不具备读取图像的能力。

怎么做? 年轻人这才意识到,必须有一种专门为视力障碍者设计的智商测试。

他尝试了一下并找到了。 然而,这种测试非常昂贵,需要1500多美元,因此不能免费进行。

无需任何人的帮助就能过上舒适的生活。 这个小家伙干脆停止了工作,开始自己动手,创建了一个为 GPT-4 量身定制的 IQ 测试版本。

打败陶哲轩难,更难打败GPT-4

首先考验的是GPT-4的数学能力。

世界上最受欢迎和顶级的数学测试是什么? 自然是国际数学奥林匹克竞赛。

陶哲轩是世界上最伟大的数学家之一,1986年参加了国际数学奥林匹克竞赛。

那一年,他连考试第六题都答不出来。

可以使用GPT-4吗?

小哥这道题输给了GPT-4,结果是——做到了,但是不对。

因此,我们不能说它超越了世界上最强大的成人数学家。

另外,它也不能证明孪生素数猜想。 (如果能证明的话,就会有鬼)

弟弟要求GPT-4画出方程的坐标,也被GPT-4拒绝。

我非常有礼貌地请求,但被拒绝了。

那么,GPT-4 的局限性是什么?

这家伙只能查公开文件。 在 OpenAI 的官方论文中,GPT-4 在 SAT 数学测试中的得分高于 91% 的人类,并且在其他数学测试中也表现出色。

不善于沟通的语言天才

接下来我想测试一下GPT-4在人际智能和内省智能方面的表现如何。

严谨的小哥先上网查了一下什么是人际智能——善于处理人际关系的人,能够更好地理解他人、与他人互动。 这些人善于评估周围人的情绪、动机、欲望和意图。

然后,他找到了一篇SAT考试的文章,复制了文章的内容,并将所有与角色动机相关的问题扔给了GPT-4。

GPT-4的性能还不错……? 四个问题中有三个是正确的。

然而,GPT-4不具备任何分析情绪的能力。

因为,按照其自己的说法,它只是一个AI模型,并没有“自我”的概念。

GPT-4的内省智能怎么样?

弟弟说,内省智力高的人,对自己的长处和短处有清醒的认识。

将其作为提示输入到 GPT-4 中,发现这个模型的定位相当清晰。

例如,优势包括丰富的知识储备、快速响应、多语言能力、模式识别能力、可扩展性强等。

缺点包括缺乏个人经验、缺乏某些领域的知识、对语境、文学解读、道德判断等的理解较差。

但弟弟却表示,这个程度的了解还远远不够。 总的来说,GPT-4的人际智能和内省智能一般。

小哥还给GPT-4做了语言智商测试,它得到了152分。

对于人类来说,这个分​​数意味着——你是一个天才。

空间推理测验

说到太空能力,GPT-4的表现并不乐观。

本来我想让GPT-4直接做一套空间推理的选择题。

GPT-4在语言能力上的智商,已经吊打人类! 小哥 智商 魔方 操作 人际 第1张

不过OpenAI未来会慢慢开发GPT-4的图像识别功能。

在 OpenAI 发布的视频中,研究人员上传了这样的图像,然后询问 GPT-4 如果绳子缩短会发生什么。

GPT-4说气球会飞走!

我哥哥用 GPT-4 玩井字棋,通过文本输入控制移动。

但GPT-4在深知规则后却作弊了。

弟弟本来应该赢,所以他请 GPT-4 帮他在底排中间画一个三圈。

GPT-4 更好,只需擦掉顶行中的圆圈并画出自己的十字即可。 作弊才能获胜。

ChatGPT:魔方?我不能

为了进一步测试GPT-4的空间理解能力,小哥使用了杀手级武器——魔方。

要知道,对于人类来说,魔方也是衡量一个人空间感的方式之一。

首先,因为GPT-4无法读取图片,所以我们首先必须想办法用文字描述魔方的状态。

熟悉魔方的朋友应该对下图不陌生。 在公式中,我们经常使用多个字母,或者字母加撇号,来表示不同的运算。

一般来说,魔方正对着我们,不同的旋转对应着不同的表情。 就像下面这样。

小哥在视频中做了演示,确保GPT-4明白这个意思。

那么,是时候带着 GPT-4 出去散步了! 看看会不会恢复。

总是从简单开始。 我的第一步是将魔方的顶层向左扭转,看看 GPT-4 是否能恢复它。

这个难度对于GPT-4来说仍然不难。 小哥输入U操作(将顶层向左转),GPT-4很快给出了答案U'(U的逆操作)。

接下来是UR,意思是顶层向左扭转一次,向右扭转一次。

GPT-4也很快提供了逆向操作——R'U'。

那么困难来了! 小兄弟开始彻底搅乱魔方,一共十多步。

令人惊讶的是,GPT-4 居然生成了结果!

然而小哥仔细一看,发现GPT-4生成的恢复方法是将所有被打乱的步骤反转。

读完我无语了,这有什么用呢?

于是小弟发现这样做就会出现这个问题。 由于输入扰码的方式,GPT-4 在恢复时必须反向操作。

问题的关键是我们不能让GPT-4知道它是如何被破坏的。

小兄弟很聪明,问GPT-4,如果是你,你会如何描述魔方的状态?

GPT-4采用如下方法:用不同的字母代替不同的颜色,用字母表达各个表面的颜色。

这样可以避免搞乱步骤。

这次尝试之后,只成功了第一次小试,也就是结果只被打乱了一次。

GPT-4在处理简单问题时确实很无情,但不幸的是,当它变得复杂时,它就变得迟钝了。

最终生成了下图所示的结果——

小兄弟说,这个真正的魔方不能扭成这样。 你在做什么 GPT-4? ?

这个结果直接宣判了GPT-4具备玩魔方的能力。

除了向后恢复之外,GPT-4根本无法解魔方。

两位总统RAP对决,泰裤火了

最后,这家伙还测试了GPT-4的音乐能力。

我们都知道GPT-4可以写诗。

在这种情况下,我要求 GPT-4 根据 Minecraft 服务器中特朗普和拜登之间的说唱大战的主题写说唱歌词和旋律,并制作一个节拍。

小弟发现最好的办法是使用ABC表示法,因为GPT-4不能写五线谱。

因此,我要求 GPT-4 使用 ABC 表示法编写 Boom bap 节拍,然后将节拍输入到音乐网站中。

GPT-4写的beat是这样的——

这听起来并不令人意外。

小兄弟想保存这个节拍,所以他换了另一种乐器。 将其下载为 midi 文件并将其上传到 FL Studio。 不好的一点是所有的乐器都合并到一个轨道中。

所以我要求 GPT-4 为每个轨道提供一个单独的乐器文件。

当成品发布时,相当惊艳:“哟!我是拜登,我是来打破纪录的,咱们开门见山吧……”

然后,我下载了一个现成的节拍,把它变成了拜登和特朗普之间的说唱大战——大家准备好尖叫吧。

总的来说,GPT-4已经在很多方面击败了人类。 如果未来有一天能够克服视觉和听觉的缺陷,人类的未来还真的很难说。

参考:

标签: 小哥 智商 魔方 操作 人际

发表评论 (已有26746条评论)

评论列表