贏(yíng)了的才是「GPT-5」。
GPT-5遲遲未現(xiàn)身,網(wǎng)友們開(kāi)始制作各種梗圖「吐槽」:
其實(shí),這幾天關(guān)于GPT-5的傳言就沒(méi)消停。
先是有網(wǎng)友在macOSChatGPT應(yīng)用中發(fā)現(xiàn)了GPT-5-Auto和GPT-5-Reasoning模型的蹤跡:
再是網(wǎng)友爆料微軟Copilot和Cursor也已經(jīng)悄咪咪接入測(cè)試GPT-5。
以下是省流版:
GPT-5將比其前代產(chǎn)品有真正的改進(jìn),但無(wú)法與早期GPT品牌型號(hào)之間的性能飛躍相提并論。
OpenAI在今年面臨了一系列技術(shù)問(wèn)題,這些問(wèn)題威脅到了o3和其他模型的進(jìn)展。
Meta挖人把OpenAI高管搞「破防」,在Slack中向上司公開(kāi)抱怨團(tuán)隊(duì)變動(dòng)。
接下來(lái),我們就詳細(xì)來(lái)吃個(gè)瓜。
GPT-5有改進(jìn),但性能飛躍大不如前
去年12月,OpenAI展示了Test-TimeScaling的測(cè)試結(jié)果,成為后預(yù)訓(xùn)練時(shí)代大模型能力的關(guān)鍵突破口。該測(cè)試表明,當(dāng)AI擁有更多時(shí)間和計(jì)算能力來(lái)處理任務(wù)時(shí),其性能會(huì)持續(xù)增加,這一技術(shù)路徑在OpenAI-o1和DeepSeek-R1的實(shí)踐中已經(jīng)初顯威力。看起來(lái),廣大ChatGPT用戶(hù)會(huì)被新AI的強(qiáng)大功能所震撼。
然而,興奮勁并沒(méi)有持續(xù)太久。
據(jù)兩位參與開(kāi)發(fā)的人透露,當(dāng)OpenAI的研究人員將這款新AI改造成基于聊天的版本o3,使其能夠響應(yīng)ChatGPT用戶(hù)的指令時(shí),之前測(cè)試基準(zhǔn)上的性能提升基本消失了。
這只是OpenAI今年面臨的大量技術(shù)挑戰(zhàn)的一個(gè)例子,越來(lái)越多的困難正在減緩AI發(fā)展的步伐,甚至可能影響到AI爆款應(yīng)用ChatGPT業(yè)務(wù)。
在即將發(fā)布的GPT-5上,OpenAI研究人員據(jù)說(shuō)已經(jīng)找到了方法。
據(jù)消息人士和OpenAI內(nèi)部工程師稱(chēng),OpenAI即將發(fā)布的一代旗艦AI模型GPT-5,在編程、數(shù)學(xué)等方面的能力有很大提升。
一個(gè)消息人士表示,新模型在編寫(xiě)應(yīng)用程序代碼時(shí),能夠更好地添加功能,使其更易于使用且更美觀(guān)。他表示,GPT-5在驅(qū)動(dòng)AI智能體以極少的人工監(jiān)督處理復(fù)雜任務(wù)方面也比其前代產(chǎn)品做得更好。例如它可以遵循復(fù)雜的指令,確定自動(dòng)客服何時(shí)應(yīng)該退款的規(guī)則列表,此前的模型需要先測(cè)試幾個(gè)棘手的客戶(hù)案例(即邊緣案例),才能處理此類(lèi)退款。
另一位知情人士表示,這些改進(jìn)無(wú)法與早期GPT模型的性能飛躍相提并論,例如2020年的GPT-3和2023年的GPT-4之間的改進(jìn)。OpenAI在過(guò)去12個(gè)月中經(jīng)歷的性能提升放緩表明,它可能很難超出其最大的競(jìng)爭(zhēng)對(duì)手,至少在A(yíng)I能力方面是這樣。
OpenAI目前的模型通過(guò)ChatGPT和各類(lèi)應(yīng)用已經(jīng)創(chuàng)造了巨大的商業(yè)價(jià)值,即使是漸進(jìn)式的改進(jìn),都會(huì)增加客戶(hù)需求。這些改進(jìn)還能讓投資者有信心為OpenAI未來(lái)三年半內(nèi)斥資450億美元購(gòu)買(mǎi)GPU,開(kāi)發(fā)和運(yùn)行產(chǎn)品的計(jì)劃提供資金。
提升自動(dòng)化編碼能力成OpenAI首要任務(wù)
最近的進(jìn)展也幫助解釋了為什么OpenAI高管最近幾周告訴一些投資者,他們認(rèn)為公司可以實(shí)現(xiàn)「GPT-8」這一目標(biāo)。這一表態(tài)與CEO山姆?奧特曼公開(kāi)的言論一致,他表示,憑借現(xiàn)有的技術(shù)知識(shí),OpenAI有望創(chuàng)造出與最聰明人類(lèi)能力相媲美的人工智能技術(shù),即AGI。
雖然距離實(shí)現(xiàn)AGI仍有很長(zhǎng)的路要走,但即將發(fā)布的GPT-5模型可能具有一些除了更好的編碼和推理之外的其他吸引力。
據(jù)一位知情的微軟員工透露,微軟擁有OpenAI知識(shí)產(chǎn)權(quán)的獨(dú)家使用權(quán),該公司的一些領(lǐng)導(dǎo)層告訴員工,他們測(cè)試該模型的結(jié)果顯示,GPT-5能夠在不消耗更多計(jì)算資源的情況下,生成更高質(zhì)量的編碼和其他基于文本的答案。
該人士表示,部分原因是它能夠比之前的模型更好地判斷哪些任務(wù)需要相對(duì)更多或更少的計(jì)算資源。
OpenAI的內(nèi)部評(píng)估顯示,在去年競(jìng)爭(zhēng)對(duì)手Anthropic率先開(kāi)發(fā)并向軟件開(kāi)發(fā)人員和Cursor等編碼助手銷(xiāo)售此類(lèi)模型后,提升人工智能自動(dòng)執(zhí)行編碼任務(wù)的能力已成為OpenAI的首要任務(wù)。
OpenAI員工認(rèn)為,自動(dòng)編碼不僅對(duì)公司業(yè)務(wù)至關(guān)重要,對(duì)于實(shí)現(xiàn)人工智能研究人員自身工作的自動(dòng)化也至關(guān)重要。
組織重組的壓力
OpenAI的進(jìn)展并非一帆風(fēng)順,因?yàn)槠溲芯咳藛T和管理層今年都面臨著新的壓力。
首先是和微軟之間微妙的關(guān)系。
盡管微軟是OpenAI最大的外部股東,并且根據(jù)雙方的合同協(xié)議,微軟有權(quán)在2030年之前使用OpenAI的一些技術(shù),但一些OpenAI的高級(jí)研究人員并不贊同將他們的創(chuàng)新和發(fā)明交給微軟。
在財(cái)務(wù)方面,微軟和OpenAI也有著非常緊密的合作關(guān)系,但在合作的具體條款上存在爭(zhēng)議,雙方都在要求對(duì)方做出一些讓步。
OpenAI希望通過(guò)重組其營(yíng)利性部門(mén),來(lái)為將來(lái)上市做準(zhǔn)備。雖然雙方在一些細(xì)節(jié)上仍然存在不確定性,但已經(jīng)有一些重要的方面達(dá)成了初步的共識(shí),比如微軟可能會(huì)在OpenAI重組后獲得約33%的股權(quán)。
其次就是Meta不斷「撬墻角」。
最近,Meta狠砸真金白銀,從OpenAI挖去了十多位研究人員,其中一些還曾參與了OpenAI近期改進(jìn)技術(shù)的工作。
這些人才流失和隨之而來(lái)的人員調(diào)整,給OpenAI的管理層帶來(lái)了壓力。
上周,OpenAI的研究副總裁JerryTworek在公司內(nèi)部的Slack中,向他的上司MarkChen抱怨了團(tuán)隊(duì)的變動(dòng),而許多同事都看到了他的抱怨。Tworek表示,他必須休息一周來(lái)重新評(píng)估情況,但后來(lái)他并沒(méi)有休假。
Orion模型的「失利」
雖然OpenAI在商業(yè)上取得了一些進(jìn)展,但公司內(nèi)部對(duì)能否持續(xù)改進(jìn)AI并保持領(lǐng)先地位仍然存在一些擔(dān)憂(yōu),特別是面對(duì)像Google、xAI和Anthropic這樣的資金雄厚的競(jìng)爭(zhēng)對(duì)手。
2024年下半年,OpenAI開(kāi)發(fā)了一個(gè)名為Orion的模型,原計(jì)劃將其作為GPT-5發(fā)布,并預(yù)計(jì)其性能會(huì)比現(xiàn)有的GPT-4o模型更強(qiáng)。然而,Orion并未達(dá)到預(yù)期的提升效果,因此OpenAI將其發(fā)布為GPT-4.5模型,結(jié)果這個(gè)模型的影響力似乎也沒(méi)多大。
Orion未能成功的部分原因在于其預(yù)訓(xùn)練階段的局限性。預(yù)訓(xùn)練是模型開(kāi)發(fā)的第一步,模型需要處理大量數(shù)據(jù)以便理解不同概念之間的聯(lián)系。OpenAI在面臨高質(zhì)量數(shù)據(jù)匱乏的同時(shí),還發(fā)現(xiàn)對(duì)Orion模型做的優(yōu)化在模型較小的時(shí)候有效,但當(dāng)模型規(guī)模增大時(shí),這些優(yōu)化就不再有效了。
o3實(shí)力強(qiáng)勁得益于更多的英偉達(dá)芯片
此外,OpenAI的研究人員還面臨其他問(wèn)題。
去年,OpenAI開(kāi)發(fā)了推理模型,這些模型在獲得更多計(jì)算資源以處理答案時(shí)表現(xiàn)得更好。這些模型源自2023年末的一項(xiàng)名為Q*的突破,這一突破震驚了公司的研究人員,因?yàn)樗軌蚪鉀Q之前從未見(jiàn)過(guò)的數(shù)學(xué)問(wèn)題。到2024年,推理模型似乎幫助公司克服了預(yù)訓(xùn)練階段性能增長(zhǎng)放緩的問(wèn)題。
去年秋天,OpenAI將第一個(gè)主要推理模型變成了o1。此次發(fā)布為OpenAI在A(yíng)I領(lǐng)域贏(yíng)得了新的影響力,并為依賴(lài)推理模型的AIAgent開(kāi)發(fā)奠定了基礎(chǔ).
據(jù)參與開(kāi)發(fā)的人士透露,OpenAI在2024年底之前創(chuàng)建了下一個(gè)推理模型o3,其基礎(chǔ)大語(yǔ)言模型與o1相同,都是GPT-4o。盡管o3和o1擁有相同的模型血統(tǒng),但o3的母模型(也稱(chēng)為教師模型)在理解各種科學(xué)領(lǐng)域及其他領(lǐng)域方面,相比o1的母模型取得了顯著的進(jìn)步。
進(jìn)步的一個(gè)原因是OpenAI決定使用更多的英偉達(dá)芯片服務(wù)器來(lái)開(kāi)發(fā)o3的母模型,這本質(zhì)上為模型提供了更強(qiáng)的處理能力,以理解復(fù)雜的概念。
另一個(gè)原因是,研究人員賦予了o3母模型搜索網(wǎng)絡(luò)或從代碼庫(kù)中獲取信息的能力,這也幫助其性能超越了o1的母模型。
兩個(gè)月前開(kāi)發(fā)的模型都稱(chēng)不上GPT-5
OpenAI公開(kāi)分享了針對(duì)該模型優(yōu)勢(shì)的特殊測(cè)試結(jié)果,不僅登上了全球頭條,還在社交媒體上引發(fā)了瘋狂的炒作,但隨后現(xiàn)實(shí)擺在了面前。
參與開(kāi)發(fā)的人員表示,當(dāng)OpenAI將o3母模型轉(zhuǎn)換為能讓人們提問(wèn)的ChatGPT版本(也稱(chēng)為學(xué)生模型)時(shí),其收益顯著下降,甚至比o1表現(xiàn)好不了多少。他們表示,當(dāng)OpenAI創(chuàng)建商用API的模型版本時(shí),也出現(xiàn)了同樣的問(wèn)題。
有知情人士表示,造成這種情況的原因之一與該模型理解概念的獨(dú)特方式有關(guān),這可能與人類(lèi)的溝通方式不同。他表示,創(chuàng)建基于聊天的版本實(shí)際上會(huì)降低原始模型的水平,因?yàn)樗枰黄仁褂萌祟?lèi)語(yǔ)言而不是自己的語(yǔ)言。
我們知道,推理模型在ChatGPT中「思考」如何解決問(wèn)題時(shí)有時(shí)會(huì)出現(xiàn)的胡言亂語(yǔ),就反映了一些溝通差異。
據(jù)另一位知情人士透露,該公司也沒(méi)有花費(fèi)太多精力以能與人類(lèi)更好溝通的目標(biāo)進(jìn)行訓(xùn)練。
盡管有所退步,OpenAI今年公開(kāi)發(fā)布的o3推理模型仍然幫助核聚變和病原體檢測(cè)等領(lǐng)域的科學(xué)家提出了新的假設(shè)和實(shí)驗(yàn)進(jìn)行測(cè)試。
然而,大語(yǔ)言模型和ChatGPT中的模型并沒(méi)有像OpenAI高管和研究人員預(yù)期的那樣順利。奧特曼告訴員工,o系列模型似乎也讓ChatGPT的客戶(hù)感到困惑,因此該公司恢復(fù)了原來(lái)GPT模型的命名規(guī)律。
據(jù)一位參與GPT-5開(kāi)發(fā)的人士透露,就在6月份由于技術(shù)問(wèn)題,OpenAI正在開(kāi)發(fā)的模型似乎都不足以被貼上GPT-5的標(biāo)簽。
GPT-5的技術(shù),還有最后的王牌
盡管如此,OpenAI仍有一招:據(jù)一位知情人士透露,他們一直在開(kāi)發(fā)一種研究人員稱(chēng)之為「通用驗(yàn)證器」(universalverifier)的東西,可以自動(dòng)執(zhí)行確保模型在強(qiáng)化學(xué)習(xí)過(guò)程中生成高質(zhì)量答案的過(guò)程。這個(gè)過(guò)程本質(zhì)上是讓一個(gè)大語(yǔ)言模型使用各種來(lái)源的研究來(lái)檢查和評(píng)分另一個(gè)模型的答案。
今年夏初,OpenAI的未公開(kāi)模型實(shí)現(xiàn)IMO金牌成績(jī)后,高級(jí)研究員AlexanderWei在X上表示,其一直在使用的強(qiáng)化學(xué)習(xí)方法是「通用的」,這意味著它也可以驗(yàn)證更主觀(guān)類(lèi)別中答案的質(zhì)量。
這些進(jìn)步似乎也在幫助OpenAI開(kāi)發(fā)GPT-5,GPT-5在軟件編程等更易驗(yàn)證的領(lǐng)域和創(chuàng)意寫(xiě)作等更主觀(guān)的領(lǐng)域都表現(xiàn)出了進(jìn)步。
包括xAI和谷歌在內(nèi)的其他公司也極為重視強(qiáng)化學(xué)習(xí),將其視為改進(jìn)AI模型的有前景的技術(shù)。OpenAI強(qiáng)化學(xué)習(xí)部門(mén)負(fù)責(zé)人Tworek最近公開(kāi)表示,他贊同OpenAI模型背后的強(qiáng)化學(xué)習(xí)系統(tǒng)才是通用人工智能(AGI)的真正構(gòu)成要素。
OpenAI即將發(fā)布的GPT-5被人們寄予厚望。山姆?奧特曼上周在與喜劇演員TheoVon的播客中大肆宣傳GPT-5的功能,并介紹了該模型如何輕松回答他不理解的問(wèn)題。奧特曼表示,「GPT-5幾乎在所有方面都比我們更聰明。」
也正是因?yàn)榍熬安诲e(cuò),OpenAI在最新一輪的融資上進(jìn)展非常順利。
新一輪融資,風(fēng)投搶著買(mǎi)單
據(jù)《紐約時(shí)報(bào)》本周五報(bào)道,OpenAI剛剛又融資了83億美元,估值達(dá)到3000億美元。這筆交易是OpenAI今年籌集400億美元資金的更廣泛戰(zhàn)略的一部分。
據(jù)報(bào)道,這輪融資超額完成,比原計(jì)劃提前了幾個(gè)月。OpenAI最初在3月份從風(fēng)投公司籌集了25億美元,當(dāng)時(shí)該公司宣布計(jì)劃在由軟銀領(lǐng)投的一輪融資中籌集400億美元。OpenAI原計(jì)劃在年底前再融資75億美元,但由于投資者在強(qiáng)勁增長(zhǎng)的背景下?tīng)?zhēng)相加入其股權(quán)結(jié)構(gòu),OpenAI最終拿到了便宜。
ChatGPT的每周活躍用戶(hù)超過(guò)7億,推動(dòng)了OpenAI的年收入已經(jīng)接近130億美元,預(yù)計(jì)到年底將達(dá)到200億美元。此外加上美國(guó)政府的《AIActionPlan》以及與微軟的談判,這些都可能幫助這家大號(hào)初創(chuàng)公司實(shí)現(xiàn)年度凈盈利的目標(biāo)。
本輪融資是由DragoneerInvestmentGroup領(lǐng)投的,其投入金額高達(dá)28億美元。許多新投資者也參與了融資,包括私募股權(quán)巨頭黑石集團(tuán)和TPG,共同基金管理公司普信(T.RowePrice),其他參與者包括AltimeterCapital、AndreessenHorowitz、CoatueManagement、D1CapitalPartners、FidelityManagement、FoundersFund、紅杉資本、老虎環(huán)球基金和ThriveCapital。
據(jù)稱(chēng),OpenAI的一些早期投資者還對(duì)他們?cè)诒据喨谫Y中獲得的資金分配較少感到沮喪。
神印王座:殺戮魔神出手的原因,龍皓晨再次召喚王座,皓月有危機(jī)
龍皓晨再次召喚王座面對(duì)實(shí)力如此強(qiáng)大的殺戮魔神,盡管龍皓晨有兩把神器的加持,但是他依舊不是殺戮魔神的對(duì)手_——。為了壓制殺戮魔神,他利用龍星宇的王座氣息召喚了末日與殺戮之神印王座。而這個(gè)王座的出現(xiàn)也宣判了殺戮魔神的死期,因?yàn)樗鼘?duì)殺戮魔神有著絕對(duì)的克制作用,幾個(gè)回合下來(lái),殺戮魔神已經(jīng)落入了下風(fēng)|-。不過(guò)殺戮魔神并沒(méi)有臨陣脫逃,因?yàn)樗诔稣鞯酱私Y(jié)束了?——。 本來(lái)龍皓晨的修為是比不上殺戮魔神的,畢竟現(xiàn)在的龍皓晨只是一個(gè)八階強(qiáng)者,還沒(méi)達(dá)到九階,自然不是殺戮魔神的對(duì)手|。但是不要忘了,龍皓晨身上有龍星宇賜的一個(gè)寶物,這個(gè)寶物可以召喚末日與殺戮之神印王座。面對(duì)殺戮魔神這個(gè)魔族九階強(qiáng)者,龍皓晨直接召喚末日與殺戮之神印王座。這個(gè)神印王座一出,立刻光芒萬(wàn)丈,很多人都希望你能滿(mǎn)意。神印王座:圣采兒認(rèn)輸,陳櫻兒召喚失敗,皓月求助龍皓晨