黃鈺名
時令發(fā)自凹非寺量子位|公眾號QbitAI
這一次,“不會”竟成了大模型的高光時刻。
雖然在IMO第6題上得了零分,OpenAI的金牌模型卻展現(xiàn)了“高智商的誠實(shí)”。
正如OpenAI研究員NoamBrown在最新訪談中所揭示的:
當(dāng)IMO推理模型會在缺乏有效證據(jù)時表示“我不確定”,這會顯著減少隱藏錯誤。
在AI摘下IMO金牌后,OpenAI金牌小分隊(duì)成員AlexWei、SherylHsu和NoamBrown參與了紅杉資本組織的一場對話,揭秘模型攻克精英數(shù)學(xué)難題的底層突破。
有網(wǎng)友幫忙總結(jié)了個太長不看版:
與過去那些“看起來完美,實(shí)則錯誤”的幻覺式答案不同,這一代大模型開始學(xué)會“承認(rèn)自己不會”。
它標(biāo)志著模型正在從胡編亂造的幻覺式回答,轉(zhuǎn)向更加可靠且具有“自我認(rèn)意識”的全新階段。
三位成員還在這場對話中,分享了更多關(guān)于沖刺IMO的有趣細(xì)節(jié)。
IMO金牌模型能承認(rèn)自己不知道
盡管數(shù)學(xué)家與計(jì)算機(jī)科學(xué)家一致認(rèn)可IMO金牌模型的價值。
但他們常常抱怨,當(dāng)模型遇到知識盲區(qū)時,它總會輸出一個令人信服但錯誤的答案。
他們不得不耗費(fèi)大量精力逐行驗(yàn)算,才能甄別那些幻覺陷阱。
IMO第6題讓大模型全軍覆沒,當(dāng)然,OpenAI也對其進(jìn)行了大量計(jì)算。
有一個由2025×2025個單位正方形組成的網(wǎng)格。Matilda希望在網(wǎng)格上放置一些矩形圖塊,這些圖塊的大小不同,但每個圖塊的每一條邊都位于網(wǎng)格線上,并且每個單位正方形最多被一個圖塊覆蓋。網(wǎng)格的每一行和每一列都恰好有一個未被任何瓷磚覆蓋的單位正方形,求出Matilda需要放置的最少瓷磚數(shù)量。
雖然投入海量算力最終僅得到一句“我無法回答”令人有些失望,但AlexWei表示:
能看到模型避免產(chǎn)生幻覺是很好的。
NoamBrown也對模型的這一轉(zhuǎn)變表示贊賞,“如果它不知道,它就會承認(rèn)它不知道?!?/p>
這代表模型開始具備“自我意識”。
這種“自我意識”可以幫助模型在面對困難問題時,承認(rèn)自己的無能為力,而不是生成一個看似合理實(shí)則錯誤的解決方案。
有趣的是,在AlexWei2024年剛加入OpenAI一周時,NoamBrown就曾問過他,團(tuán)隊(duì)何時能獲得IMO金牌。
當(dāng)時AlexWei認(rèn)為2025年不太可能實(shí)現(xiàn)。
但令人驚嘆的是,這個三人團(tuán)隊(duì)僅用了兩月,就完成了他們一直在追求的目標(biāo)——IMO金牌。
NoamBrown還表示:
OpenAI有一個很棒的地方,就是研究人員有很大的自主權(quán)去做他們認(rèn)為有影響力的研究。
Alex還強(qiáng)調(diào),他們的團(tuán)隊(duì)“真正優(yōu)先考慮通用技術(shù)”,而不是專門開發(fā)用于數(shù)學(xué)競賽的系統(tǒng)。
OpenAIIMO金牌核心團(tuán)隊(duì)
OpenAIIMO核心團(tuán)隊(duì)僅由三名研究人員構(gòu)成。
AlexWei,本碩均就讀于哈佛大學(xué),隨后在加州大學(xué)伯克利分校獲得計(jì)算機(jī)科學(xué)博士學(xué)位。
Alex還曾在谷歌、微軟和Meta實(shí)習(xí),后于2024年1月加入OpenAI,現(xiàn)任研究科學(xué)家。他曾是FAIR團(tuán)隊(duì)成員,參與開發(fā)了首個用于外交游戲的人類級人工智能——CICERO。
SherylHsu,畢業(yè)于斯坦福大學(xué)計(jì)算機(jī)科學(xué)專業(yè),是斯坦福AI實(shí)驗(yàn)室中IRIS實(shí)驗(yàn)室的研究員,于2025年3月加入OpenAI。
NoamBrown,本科就讀于美國羅格斯新澤西州立大學(xué)新布朗斯維克分校,隨后在卡內(nèi)基·梅隆大學(xué)獲碩士和博士學(xué)位。他曾任職于DeepMind和Meta,于2023年6月加入OpenAI。
參考鏈接:[1]https://x.com/chatgpt21/status/1950606890758476264[2]https://www.youtube.com/watch?v=EEIPtofVe2Q
好看的穿書甜寵文五本推薦二十七
陳鋒點(diǎn)了點(diǎn)頭,對于自己的按摩手法,那絕對是十分自信,一百零八式絕對不是浪的虛名————。這時候,一個穿著旗袍,身材婀娜的女子走了過來,大概三十多歲的樣子,眉眼間嫵媚伊人,掃了一眼陳鋒,捂著嘴笑道:“不錯,這個小伙子白白嫩嫩,晚上要是沒事的話,可以來我房間,試試技術(shù)?!标愪h不由一陣感慨,現(xiàn)在的人,..
重生甜寵文,重活一世面對深愛的男人,她開啟360度花式撩漢模式
今日推薦:《軍婚獨(dú)寵:小妻撩漢十八式》作者:一曲離歌--。點(diǎn)擊文末超鏈接開始觀看吧~第一百零四章L君她的腦里連道歉的話都已經(jīng)準(zhǔn)備就緒——_。只見男人伸出他修長的手指,在她胸前的暗紋上跟著筆畫,描繪了一遍|?!澳憧梢越形襆,這是你完美的穿上我衣服的報(bào)酬。但是想知道其他,那就需要另外付出了?!蹦腥艘稽c(diǎn)希望你能滿意。
峨眉派的五個龍形拳種概說
一九八零年,八月__。龍國東北地區(qū),臨河縣紅旗公社下面的橫山大隊(duì)。田間地里都是社員們積極向上辛苦耕作的身影。在大隊(duì)西邊一顆干枯榕樹旁的土胚房里,林月此時一個人正躺在大炕上,怒其不爭的罵罵咧咧。“這傻帽,重生這么好的機(jī)緣落你身上,你竟然不知道珍惜!”“這賊老天,也真是瞎了眼了,你不想活了就去希望你能滿意-。
來源:紅網(wǎng)
作者:陳家瑋
編輯:諸初柳
本文為紅辣椒評論 原創(chuàng)文章,僅系作者個人觀點(diǎn),不代表紅網(wǎng)立場。轉(zhuǎn)載請附原文出處鏈接和本聲明。