新智元報道
Aeneas
【新智元導(dǎo)讀】GPT-5要來了,來勢洶洶!泄露的基準測試+Minecraft實測,直接讓全網(wǎng)驚掉下巴:代號Zenith的GPT-5-pro在游戲中如行云流水,被稱為「魔法級AI」。更有爆料稱它將于7月31日發(fā)布,吊打Grok4Heavy!OpenAI這是又要掀桌了?
一大早,關(guān)于GPT-5的消息又來了。
這些泄露的GPT-5基準測試,很可能是真實的。
甚至還有一個炸裂消息:GPT-5將于7月31日發(fā)布。
為此,現(xiàn)在所有GPT-5模型,已正式退出WebDev競技場。
不過還有另外的說法,來自MenloVentures投資人Deedy,以及TheVerge、TheInformation等外媒,據(jù)說GPT-5會在8月亮相。
雖然GPT-5還沒來,但有關(guān)它的實測已經(jīng)全網(wǎng)滿天飛了。
就在剛剛,又有一位放出了GPT-5在Minecraft中的實測。準確地說,是內(nèi)部代號zenith的GPT-5-pro。
這位網(wǎng)友評價道:「令人印象深刻,簡直就是魔法!OpenAI確實做出了一些令人難以置信的東西?!?/p>
在這個視頻中,GPT-5行云流水地一次性完成了游戲任務(wù),表現(xiàn)實在驚艷。
把網(wǎng)友們的期待值拉得這么高,GPT-5正式發(fā)布的時候必然得超級炸裂了,否則都不知道該怎么收場。
還有一個重磅爆料,來自知名爆料人JimmyApple。
根據(jù)他的說法,很多內(nèi)部評估人員對GPT-5的評價是——比Grok4Heavy還要強。
GPT-5要來,全員屏息等待
現(xiàn)在,GPT-5的氣息是越來越近了。
甚至有人發(fā)現(xiàn),當(dāng)自己在app中選擇o3時,竟意外測試到了某個版本的GPT-5。
不小心測到GPT-5的人,越來越多。
關(guān)于它本周上線的消息,也得到了越來越多人的證實。
而TheVerge的說法稍有不同,根據(jù)他們的情報,GPT-5將于8月初發(fā)布,包括mini和nano版本。
此前曾有開發(fā)者發(fā)現(xiàn),GPT-5在內(nèi)部被命名為「推理alpha版」。
同時,一個代號「o3-alpha」的模型,才上線了12小時就迅速下架,許多人公認:這就是GPT-5的早期殼。
根據(jù)OpenAI慣例,從測試到發(fā)布間隔最短僅4天,所以,GPT-5真的已經(jīng)相當(dāng)近了。
就在昨天,大家已經(jīng)發(fā)現(xiàn)了GPT-5可以在LMArena上使用。同時被發(fā)現(xiàn)的還有Zenith模型。
下面這些實例,也已經(jīng)被全網(wǎng)瘋轉(zhuǎn)。
生成來自遙遠未來的星艦控制面板。
創(chuàng)建一個流媒體網(wǎng)站。
在機器人行走方面完美呈現(xiàn)SVG動畫。
史上最好的菠蘿防御游戲。
融合o系列和GPT系列
毫無疑問,現(xiàn)在GPT-5已經(jīng)是全球最受期待的模型。
很多人相信,GPT-5將是一個意義非凡的里程碑,將吸引數(shù)百萬用戶加入AI生態(tài)系統(tǒng)。
接下來,我們會梳理一番過去這段時間,GPT-5被提及的種種蛛絲馬跡。
在關(guān)于OpenAI智能體的一次直播中,GPT-5就曾被提及。
當(dāng)時的關(guān)鍵信息是:這個令人驚嘆的前沿模型,將首次統(tǒng)一兩個系列的模型,集中了o系列在推理方面的突破,以及GPT系列在多模態(tài)方面的突破。
因為ChatGPT有各種型號的模型,每個模型都有自己獨特的功能和突出的特點,如果GPT-5真的是每個單一模型最佳部分的集合,很顯然用戶體驗將徹底改變。
比如用過o3的人就知道,從GPT-4o到o3的飛躍有多么瘋狂。
這一點,早在今年2月,就得到了OpenAICPOKevinWeil的證實。
網(wǎng)友問道:你們會制作模型路由器,還是它們會以系統(tǒng)的方式更加統(tǒng)一?Weil表示,會更統(tǒng)一
另外還有一個疑似OpenAI內(nèi)部員工的爆料。他表示,研究者們的確嘗試了路由方法,不過產(chǎn)生了很多幻覺。
所以,他們在測試一個能規(guī)劃、推理、可以像擴展一樣運用智能體的模型。
然后就是外媒TheInformation的一些爆料了。
總結(jié)來說就是,GPT-5編碼極強。
在自然科學(xué)領(lǐng)域,推理更深入;
在瀏覽器里自動完成復(fù)雜任務(wù);
寫作更流暢,邏輯更在線;
更重要的是:在編碼上有炸裂提升!
根據(jù)一位體驗者的說法,GPT-5不僅更善于解決學(xué)術(shù)和編程競賽問題上,甚至在處理現(xiàn)實世界工程師面對的實際編程任務(wù)時,表現(xiàn)都更加驚艷了。
比如那種包含大量屎山遺留代碼的龐雜代碼庫,它能都能進行修改,完全沒在怕的。
正是這種處理復(fù)雜場景的細致能力,讓OpenAI的模型過去始終落后于Anthropic。畢竟在開發(fā)者群體中,大家都公認,Claude才是真正的編程王者。
一位體驗者親測后表示,GPT-5在編程上,甚至直接勝過了Anthropic的ClaudeSonnet4!
另外的說法就是,GPT-5不是一個統(tǒng)一的模型,而是一個路由器機制。
它會根據(jù)問題的類型,把你的提問發(fā)送給一個擅長閑聊GPT大模型,或是一個擅長邏輯和推理的o系列模型。
最終我們所看到的GPT-5的表現(xiàn),就是這倆模型組合拳的效果。
甚至還有OpenAI高管私下這樣預(yù)言——
我們在不換架構(gòu)的前提下,有信心做到GPT-8。
也就是說,OpenAI并沒有打算卷新架構(gòu),而是靠更聰明的調(diào)度、更強的推理、更多的后訓(xùn)練數(shù)據(jù),一步一步把現(xiàn)有技術(shù)用到極致。
GPT-5,會給世界帶來什么?
同時,奧特曼在最近的采訪中關(guān)于「GPT-5讓自己覺得毫無用處」的說法,讓更多人期待值拉滿了。
也有人說,GPT-5很可能是目前AI領(lǐng)域正在發(fā)生的最危險的事情之一。
比如奧特曼就在這次采訪中提到,很多人整天都在和AI聊天,甚至把它當(dāng)作自己的男友或女友。
還有一些孩子們,在成長過程中完全靠著滾動屏幕的方式獲取多巴胺。這幾件事都很危險。
當(dāng)主持人問出:如何防止AI產(chǎn)生與社交媒體相同的負面影響?奧特曼誠實地承認道:我很害怕這件事,我沒有答案。
令人擔(dān)憂的是,就在前幾天,一位OpenAI的投資人承認,自己因為整天使用ChatGPT,已經(jīng)出現(xiàn)了一些不正常的狀況。
也就是說,即使是有錢人,也會因為跟AI聊天被誘發(fā)精神病。
奧特曼甚至表示,自己對給地球上的每個人發(fā)放免費運行的GPT-5十分感興趣。
當(dāng)這些AI產(chǎn)品和服務(wù)以1/100成本被提供時,很顯然,某些經(jīng)濟體會迅速轉(zhuǎn)型和瓦解。
但是,不管會給世界造成怎樣的狂潮,GPT-5要上線的架勢,如今已經(jīng)是無法阻擋了。
參考資料:
https://x.com/chetaslua/status/1949905375546708242
https://www.youtube.com/watch?v=0jDsWemXi3U
延伸閱讀:與 驅(qū)動產(chǎn)業(yè)“闖新”:!!路 的相關(guān)文章