如何評(píng)價(jià)楊冪在《長(zhǎng)安的荔枝》里的演技?
新智元報(bào)道
定慧Aeneas
【新智元導(dǎo)讀】就在剛剛,GPT-5悄悄身披馬甲出道了?一個(gè)代號(hào)為「Lobster(龍蝦)」的神秘模型在WebDevArena橫空出世,輕松吊打Grok-4,網(wǎng)友紛紛猜測(cè):這就是GPT-5本尊!更有提前試用者曝出:GPT-5編程能力驚人,甚至能改屎山代碼。
GPT-5來了?但是「龍蝦」版!
GPT-5「Lobster」疑似現(xiàn)身WebDevArena,引發(fā)社區(qū)狂熱猜測(cè):網(wǎng)友實(shí)測(cè)比Grok-4好的離譜。
WebDevArena是一個(gè)大模型能力匿名評(píng)測(cè)的網(wǎng)站,使用相同的提示詞,在雙盲的情況下,給你認(rèn)為最好的模型投票。
很多待發(fā)布的模型,都會(huì)有各種各樣「奇怪」的代號(hào)提前進(jìn)行實(shí)測(cè)。
LisanalGaib在實(shí)測(cè)中捕捉了GPT-5!
并且用同樣的提示詞,GPT-5生成的頁(yè)面效果非常驚艷(左邊是GPT-5,右邊Grok-4)。
他使用的提示詞是:
Createastunning,interactiveanimationofaneuralnetworkorbrain-likegraphstructure—useartisticcolors,smoothtransitions,andbeautifulvisuals.Thepageshouldfeelalive,immersive,andimpressive,withnobuttons—justscrollingorcontinuousanimation.Makeitbreathtaking.
創(chuàng)建一個(gè)令人驚嘆的神經(jīng)網(wǎng)絡(luò)或類腦圖結(jié)構(gòu)的交互式動(dòng)畫——使用藝術(shù)性的色彩、平滑的過渡和精美的視覺效果。整個(gè)頁(yè)面應(yīng)充滿活力、沉浸感和震撼力,不使用任何按鈕,僅通過滾動(dòng)或持續(xù)的動(dòng)畫進(jìn)行交互。讓其令人嘆為觀止。
疑似GPT-5,并且命名為「龍蝦」的LLM給出了驚艷的答案。
此外,GPT-5其他版本的代號(hào)也疑似曝光。
GPT-5:Lobster
GPT-5-mini:Nectarine
GPT-5-nano:Starfish
GPT-5:Lobster
GPT-5-mini:Nectarine
GPT-5-nano:Starfish
多位用戶表示該模型在代碼生成、交互表現(xiàn)上已超越Claude,令他們震驚。
與此同時(shí),Reddit網(wǎng)友發(fā)現(xiàn),OpenAI現(xiàn)在正在將所有o3請(qǐng)求秘密地轉(zhuǎn)接到GPT-5上處理。(LMArena中新的匿名OpenAI模型「zenith」,所以O(shè)penAI為了測(cè)試GPT-5到底起了多少「外號(hào)」?)
它現(xiàn)在能夠處理o3在「正確/接近正確的解答率」只有0%的極高難度數(shù)學(xué)問題,并且在風(fēng)格上與o3有顯著不同。
甚至,有網(wǎng)友表示,已經(jīng)有非科技行業(yè)的員工已經(jīng)獲得了GPT-5預(yù)覽版的訪問權(quán)限。
但可能由于保密協(xié)議的關(guān)系,無法知曉到底是哪家公司能這么幸運(yùn)被隨機(jī)選中。
看來GPT-5已經(jīng)是箭在弦上了!
GPT-5搶先體驗(yàn):實(shí)錘了,很強(qiáng)
顯然,如今GPT-5如今已經(jīng)近在咫尺。
比如OpenAICEO奧特曼,就已經(jīng)開始在各個(gè)場(chǎng)合暗戳戳地宣揚(yáng)這個(gè)強(qiáng)大的神秘模型。
在最近的一次采訪中,他這樣描述了自己對(duì)GPT-5的使用初體驗(yàn)。
與此同時(shí),AI圈也按捺不住地躁動(dòng)起來。已經(jīng)有多位提前體驗(yàn)GPT-5的用戶出來透露說,GPT-5的表現(xiàn)極其驚艷!
不過,目前我們尚未得知,GPT-5究竟會(huì)在何時(shí)發(fā)布,會(huì)提供給哪些客戶。
據(jù)悉,GPT-5旨在實(shí)現(xiàn)奧特曼的一項(xiàng)計(jì)劃:將傳統(tǒng)的GPT系列大模型與o系列推理模型,整合進(jìn)一個(gè)統(tǒng)一的模型界面中。
現(xiàn)在,外媒已經(jīng)為我們收集了一波體驗(yàn)者的感想。
簡(jiǎn)單來說就是——
在自然科學(xué)領(lǐng)域,推理更深入;
在瀏覽器里自動(dòng)完成復(fù)雜任務(wù);
寫作更流暢,邏輯更在線;
更重要的是:在編碼上有炸裂提升!
GPT-5跟Anthropic的混合式Claude模型類似。在未來,用戶或許能控制GPT-5對(duì)特定問題思考的深度,模型自身也會(huì)根據(jù)問題的難易度,自動(dòng)開啟或關(guān)閉推理能力。
也就是說,如果我們?nèi)枴竤trawberry里有幾個(gè)r」這種問題,即使我們要求,它也不會(huì)傻到去耗費(fèi)巨額算力來思考。
如果你問它「怎么優(yōu)化一個(gè)10年沒動(dòng)的數(shù)據(jù)庫(kù)結(jié)構(gòu)」,它才開始認(rèn)真調(diào)用深層邏輯能力。
但其中一位體驗(yàn)者表示,GPT-5最顯著的進(jìn)步,就體現(xiàn)在編程上!
程序員哭了:屎山代碼有救了?
根據(jù)他的說法,GPT-5不僅更善于解決學(xué)術(shù)和編程競(jìng)賽問題上,甚至在處理現(xiàn)實(shí)世界工程師面對(duì)的實(shí)際編程任務(wù)時(shí),表現(xiàn)都更加驚艷了。
比如那種包含大量屎山遺留代碼的龐雜代碼庫(kù),它能都能進(jìn)行修改,完全沒在怕的。
正是這種處理復(fù)雜場(chǎng)景的細(xì)致能力,讓OpenAI的模型過去始終落后于Anthropic。畢竟在開發(fā)者群體中,大家都公認(rèn),Claude才是真正的編程王者。
一位體驗(yàn)者親測(cè)后表示,GPT-5在編程上,甚至直接勝過了Anthropic的ClaudeSonnet4!
因此,我們可以直接窺見OpenAI在自動(dòng)化復(fù)雜編程上的野心了。
畢竟,目前市面上最能賺錢的AI產(chǎn)品之一就是編程助手,像Cursor就靠Claude賺得盆滿缽滿,據(jù)說年?duì)I收都達(dá)到上億美元了。
顯然,OpenAI很想把這塊大蛋糕搶回來。
不僅如此,在OpenAI領(lǐng)導(dǎo)層的眼里,是否能自動(dòng)化真實(shí)世界的復(fù)雜編程任務(wù),就是實(shí)現(xiàn)AGI的關(guān)鍵。
安撫英偉達(dá)和投資人
總之,如果GPT-5表現(xiàn)強(qiáng)勁,對(duì)于英偉達(dá)、數(shù)據(jù)中心建設(shè)公司和投資者而言,都能起到很好的安撫作用。
畢竟在去年,曾有一波大模型撞墻論曝出。
而GPT-5的好消息,就意味著即使預(yù)訓(xùn)練的邊際收益遞減也沒關(guān)系,因?yàn)樘嵘鼳I模型能力的真正關(guān)鍵,就在于后訓(xùn)練階段的強(qiáng)化學(xué)習(xí)。
也就是說,OpenAI的路線沒有撞墻,只是換道超車了!
另外還有個(gè)細(xì)節(jié),此次更加被證實(shí)。
它會(huì)根據(jù)問題的類型,把你的提問發(fā)送給一個(gè)擅長(zhǎng)閑聊GPT大模型,或是一個(gè)擅長(zhǎng)邏輯和推理的o系列模型。
最終我們所看到的GPT-5的表現(xiàn),就是這倆模型組合拳的效果。
彩蛋:GPT-8都在路上了?
甚至這次,還有投資人爆料,OpenAI高管曾私下說——
我們?cè)诓粨Q架構(gòu)的前提下,有信心做到GPT-8。
這可實(shí)在太猛了。雖然聽起來像是「PPT先行」,但也傳遞出一個(gè)關(guān)鍵信息。
OpenAI并沒有打算卷新架構(gòu),而是靠更聰明的調(diào)度、更強(qiáng)的推理、更多的后訓(xùn)練數(shù)據(jù),一步一步把現(xiàn)有技術(shù)用到極致。
所以,照例每日一問:GPT-5啥時(shí)候來?
參考資料: