最近,有位老外测试了GPT-4的智商,结果显示它的语言智商达到了152。
据调查,人类的平均智商为90-109。 仅就语言智商而言,人类已经彻底被GPT-4打败了……
我们早已熟悉 GPT-4 的功能。 3月底,微软一篇长达154页的论文震惊了世界。
微软在论文中表示,GPT-4展现了通用人工智能的火花,可以认为是通用人工智能的早期版本。
论文地址:
通过测试,微软研究人员证实,GPT-4不仅精通语言,而且在数学、编程、视觉、医学、法律和心理学等多样化、困难的任务中也能表现出色,而无需特殊提示。
最可怕的是,在所有这些任务上,GPT-4 的表现都接近人类水平,并且常常超过以前的模型。
接下来我们就来看看GPT-4在各个方面的能力,哪些可以打败人类,哪些还赶不上我们。
为 GPT-4 量身定制的 IQ 测试
首先,这家伙在网上搜索免费的智商测试。
但他发现了一个棘手的问题:这些智商测试很多都是图像的形式。
不过,GPT-4目前可以认为是“盲人”+“聋人”,不具备读取图像的能力。
怎么做? 年轻人这才意识到,必须有一种专门为视力障碍者设计的智商测试。
他尝试了一下并找到了。 然而,这种测试非常昂贵,需要1500多美元,因此不能免费进行。
无需任何人的帮助就能过上舒适的生活。 这个小家伙干脆停止了工作,开始自己动手,创建了一个为 GPT-4 量身定制的 IQ 测试版本。
打败陶哲轩难,更难打败GPT-4
首先考验的是GPT-4的数学能力。
世界上最受欢迎和顶级的数学测试是什么? 自然是国际数学奥林匹克竞赛。
陶哲轩是世界上最伟大的数学家之一,1986年参加了国际数学奥林匹克竞赛。
那一年,他连考试第六题都答不出来。
可以使用GPT-4吗?
小哥这道题输给了GPT-4,结果是——做到了,但是不对。
因此,我们不能说它超越了世界上最强大的成人数学家。
另外,它也不能证明孪生素数猜想。 (如果能证明的话,就会有鬼)
弟弟要求GPT-4画出方程的坐标,也被GPT-4拒绝。
我非常有礼貌地请求,但被拒绝了。
那么,GPT-4 的局限性是什么?
这家伙只能查公开文件。 在 OpenAI 的官方论文中,GPT-4 在 SAT 数学测试中的得分高于 91% 的人类,并且在其他数学测试中也表现出色。
不善于沟通的语言天才
接下来我想测试一下GPT-4在人际智能和内省智能方面的表现如何。
严谨的小哥先上网查了一下什么是人际智能——善于处理人际关系的人,能够更好地理解他人、与他人互动。 这些人善于评估周围人的情绪、动机、欲望和意图。
然后,他找到了一篇SAT考试的文章,复制了文章的内容,并将所有与角色动机相关的问题扔给了GPT-4。
GPT-4的性能还不错……? 四个问题中有三个是正确的。
然而,GPT-4不具备任何分析情绪的能力。
因为,按照其自己的说法,它只是一个AI模型,并没有“自我”的概念。
GPT-4的内省智能怎么样?
弟弟说,内省智力高的人,对自己的长处和短处有清醒的认识。
将其作为提示输入到 GPT-4 中,发现这个模型的定位相当清晰。
例如,优势包括丰富的知识储备、快速响应、多语言能力、模式识别能力、可扩展性强等。
缺点包括缺乏个人经验、缺乏某些领域的知识、对语境、文学解读、道德判断等的理解较差。
但弟弟却表示,这个程度的了解还远远不够。 总的来说,GPT-4的人际智能和内省智能一般。
小哥还给GPT-4做了语言智商测试,它得到了152分。
对于人类来说,这个分数意味着——你是一个天才。
空间推理测验
说到太空能力,GPT-4的表现并不乐观。
本来我想让GPT-4直接做一套空间推理的选择题。
不过OpenAI未来会慢慢开发GPT-4的图像识别功能。
在 OpenAI 发布的视频中,研究人员上传了这样的图像,然后询问 GPT-4 如果绳子缩短会发生什么。
GPT-4说气球会飞走!
我哥哥用 GPT-4 玩井字棋,通过文本输入控制移动。
但GPT-4在深知规则后却作弊了。
弟弟本来应该赢,所以他请 GPT-4 帮他在底排中间画一个三圈。
GPT-4 更好,只需擦掉顶行中的圆圈并画出自己的十字即可。 作弊才能获胜。
ChatGPT:魔方?我不能
为了进一步测试GPT-4的空间理解能力,小哥使用了杀手级武器——魔方。
要知道,对于人类来说,魔方也是衡量一个人空间感的方式之一。
首先,因为GPT-4无法读取图片,所以我们首先必须想办法用文字描述魔方的状态。
熟悉魔方的朋友应该对下图不陌生。 在公式中,我们经常使用多个字母,或者字母加撇号,来表示不同的运算。
一般来说,魔方正对着我们,不同的旋转对应着不同的表情。 就像下面这样。
小哥在视频中做了演示,确保GPT-4明白这个意思。
那么,是时候带着 GPT-4 出去散步了! 看看会不会恢复。
总是从简单开始。 我的第一步是将魔方的顶层向左扭转,看看 GPT-4 是否能恢复它。
这个难度对于GPT-4来说仍然不难。 小哥输入U操作(将顶层向左转),GPT-4很快给出了答案U'(U的逆操作)。
接下来是UR,意思是顶层向左扭转一次,向右扭转一次。
GPT-4也很快提供了逆向操作——R'U'。
那么困难来了! 小兄弟开始彻底搅乱魔方,一共十多步。
令人惊讶的是,GPT-4 居然生成了结果!
然而小哥仔细一看,发现GPT-4生成的恢复方法是将所有被打乱的步骤反转。
读完我无语了,这有什么用呢?
于是小弟发现这样做就会出现这个问题。 由于输入扰码的方式,GPT-4 在恢复时必须反向操作。
问题的关键是我们不能让GPT-4知道它是如何被破坏的。
小兄弟很聪明,问GPT-4,如果是你,你会如何描述魔方的状态?
GPT-4采用如下方法:用不同的字母代替不同的颜色,用字母表达各个表面的颜色。
这样可以避免搞乱步骤。
这次尝试之后,只成功了第一次小试,也就是结果只被打乱了一次。
GPT-4在处理简单问题时确实很无情,但不幸的是,当它变得复杂时,它就变得迟钝了。
最终生成了下图所示的结果——
小兄弟说,这个真正的魔方不能扭成这样。 你在做什么 GPT-4? ?
这个结果直接宣判了GPT-4具备玩魔方的能力。
除了向后恢复之外,GPT-4根本无法解魔方。
两位总统RAP对决,泰裤火了
最后,这家伙还测试了GPT-4的音乐能力。
我们都知道GPT-4可以写诗。
在这种情况下,我要求 GPT-4 根据 Minecraft 服务器中特朗普和拜登之间的说唱大战的主题写说唱歌词和旋律,并制作一个节拍。
小弟发现最好的办法是使用ABC表示法,因为GPT-4不能写五线谱。
因此,我要求 GPT-4 使用 ABC 表示法编写 Boom bap 节拍,然后将节拍输入到音乐网站中。
GPT-4写的beat是这样的——
这听起来并不令人意外。
小兄弟想保存这个节拍,所以他换了另一种乐器。 将其下载为 midi 文件并将其上传到 FL Studio。 不好的一点是所有的乐器都合并到一个轨道中。
所以我要求 GPT-4 为每个轨道提供一个单独的乐器文件。
当成品发布时,相当惊艳:“哟!我是拜登,我是来打破纪录的,咱们开门见山吧……”
然后,我下载了一个现成的节拍,把它变成了拜登和特朗普之间的说唱大战——大家准备好尖叫吧。
总的来说,GPT-4已经在很多方面击败了人类。 如果未来有一天能够克服视觉和听觉的缺陷,人类的未来还真的很难说。
参考:
评论列表