【新智元導(dǎo)讀】近日,一名外國(guó)小哥測(cè)出,GPT-4語(yǔ)言能力智商已達(dá)15編程客棧2,吊打絕大多數(shù)人類(lèi)。好在,它的空間推理還不行。
GPT-4在語(yǔ)言能力上的智商,已經(jīng)吊打人類(lèi)!
(資料圖片)
最近,國(guó)外的一位小哥測(cè)試了GPT-4的智商,結(jié)果顯示,它的語(yǔ)言智商已經(jīng)達(dá)到了152。
而根據(jù)調(diào)查,人類(lèi)的平均智商是90-109,單論語(yǔ)言智商的話,人類(lèi)是妥妥地被GPT-4吊打了……
GPT-4的能力,我們此前早已耳熟能詳。3月底,微android軟的一篇154頁(yè)的論文,震驚全世界。
在這篇論文中,微軟表示,GPT-4已經(jīng)顯現(xiàn)出了通用人工智能的火花,它可以被認(rèn)為是通用人工智能的一個(gè)早期版本。
論文地址:https://arxiv.org/pdf/2303.12712.pdf
通過(guò)測(cè)試,微軟的研究者證實(shí):GPT-4不僅精通語(yǔ)言,還能python在數(shù)學(xué)、編程、視覺(jué)、醫(yī)學(xué)、法律、心理學(xué)等多樣化和高難度的任務(wù)中表現(xiàn)出色,且無(wú)需特別提示。
最可怕的是,在所有這些任務(wù)中,GPT-4的表現(xiàn)都接近了人類(lèi)水平,并且時(shí)常超過(guò)之前的模型。
下面,我們就來(lái)看看GPT-4在各方面能力上,哪些能吊打人類(lèi)編程客棧,哪些暫時(shí)還無(wú)法趕超我們。
為GPT-4量身打造IQ測(cè)試
首先,這位小哥上網(wǎng)搜索了一下免費(fèi)的智商測(cè)試。
但他發(fā)現(xiàn)一個(gè)棘手的問(wèn)題:這些智商測(cè)試,很多都是以圖像的形式。
然而GPT-4,目前可以被認(rèn)為還是一個(gè)「瞎子」+「聾子」,并沒(méi)有讀圖能力。
怎么辦呢php?這位小哥隨后意識(shí)到,肯定有專門(mén)為視力缺陷的人設(shè)計(jì)的智商測(cè)試。
他動(dòng)手試了試,果然搜到了。然而,這種測(cè)試非常昂貴,需要花1500多刀,沒(méi)法白嫖。
自己動(dòng)手,豐衣足食。這位小哥干脆一不做二不休,自己上手,為GPT-4量身打造了一版智商測(cè)試。
難得倒陶哲軒,難不倒GPT-4
首先要測(cè)試的,是GPT-4的數(shù)學(xué)能力。
全世界最流行、最頂尖的數(shù)學(xué)測(cè)試是什么?自然就是國(guó)際奧數(shù)比賽。
世界上最偉大的數(shù)學(xué)家之一陶哲軒,就是在1986年參加的國(guó)際奧數(shù)比賽。
那一年,試題中的第6題,連他也解不出。
那GPT-4可以么?
小哥把這道題輸給了GPT-4,結(jié)果是——它做了,但沒(méi)做對(duì)。
因此,我們并不能說(shuō),它勝過(guò)了世界上最厲害的成年人數(shù)學(xué)家。
另外,它也無(wú)法證明孿生素?cái)?shù)猜想。(要是能證明就有鬼了
責(zé)任編輯: