機器之心報道
機器之心編輯部
剛剛,谷歌DeepMind宣布,其新一代Gemini進階版模型在IMO競賽中正式達(dá)到金牌得主水平,成功解決了六道超高難度試題中的五道,拿下35分(滿分42分),成為首個獲得奧賽組委會官方認(rèn)定為金牌的AI系統(tǒng)。
更重要的是,該系統(tǒng)首次證明人工智能無需依賴專業(yè)編程語言,僅通過自然語言理解即可攻克復(fù)雜數(shù)學(xué)難題。
谷歌DeepMind首席執(zhí)行官哈薩比斯在社交媒體平臺X上強調(diào):這是官方結(jié)果!
谷歌這項成績遠(yuǎn)超其在2024年的表現(xiàn)。當(dāng)時,AlphaProof和AlphaGeometry系統(tǒng)組合解決了六個問題中的四個,榮獲銀牌。
今年的突破來自GeminiDeepThink,這是一個增強型推理系統(tǒng),采用了研究人員所謂的并行思維。與遵循單一推理鏈的傳統(tǒng)人工智能模型不同,DeepThink會同時探索多種可能的解決方案,最終得出答案。
哈薩比斯在后續(xù)帖子中解釋道:谷歌的模型以自然語言進行端到端運行,直接從官方問題描述中生成嚴(yán)格的數(shù)學(xué)證明。并強調(diào),該系統(tǒng)在比賽標(biāo)準(zhǔn)的4.5小時時限內(nèi)完成了任務(wù)。
谷歌這次官宣,讓OpenAI處于尷尬的處境,畢竟OpenAI因繞過官方競賽規(guī)則提前官宣,遭到很多人吐槽??蓞⒖肌禣penAI拿IMO金牌是火了,但惹怒大批人:搶發(fā)炒作,搶學(xué)生風(fēng)頭》。
谷歌DeepMind這種謹(jǐn)慎的發(fā)布方式贏得了AI界的廣泛贊譽,尤其與競爭對手OpenAI對類似成績的處理方式形成了鮮明對比。
「我們沒有在周五宣布這一消息,是因為我們尊重IMO理事會最初的要求,即所有人工智能實驗室只有在官方結(jié)果經(jīng)過獨立專家驗證,并且學(xué)生獲得應(yīng)有的贊譽后,才能分享其成果?!构_比斯寫道。
對比之下,大家都在譴責(zé)OpenAI做事不地道、毫無風(fēng)度、無禮。反觀谷歌DeepMind,行事正直,符合人性。
這種批評源于OpenAI決定在不參與IMO官方評估流程的情況下公布自己的成績。OpenAI讓一個由前IMO參賽選手組成的小組對其AI的表現(xiàn)進行評分,社區(qū)中的一些人認(rèn)為這種做法缺乏可信度。
OpenAI又來回應(yīng)了
OpenAI研究科學(xué)家NoamBrown向谷歌發(fā)來祝賀,說是祝賀,更多的是為了回應(yīng)質(zhì)疑。以下是回應(yīng)內(nèi)容。
谷歌采用的方法與我們略有不同,這表明還有很多研究方向值得探討。
兩個月前,IMO組委會曾通過郵件邀請我們參加基于Lean語言的正式比賽。由于我們一直致力于不受Lean限制的自然語言通用推理研究,因此婉拒了該邀請。組委會從未就自然語言解題形式與我們進行過接洽。
在過去的幾個月里,我們在通用推理方面取得了很大進展。這包括收集、整理和訓(xùn)練高質(zhì)量的數(shù)學(xué)數(shù)據(jù),這些數(shù)據(jù)也將用于未來的模型。在IMO評估中,我們沒有使用RAG或任何其他工具。
我們提交的每份證明都由三位外部IMO獎牌獲得者評分,并獲得了一致的正確性認(rèn)可。我們還將證明公開發(fā)布,以便任何人都可以驗證其正確性。
證明地址:https://github.com/aw31/openai-imo-2025-proofs/
在分享我們的結(jié)果之前,我們與IMO的一位董事會成員進行了交談,他要求我們等到頒獎典禮結(jié)束后再公開結(jié)果,我們的發(fā)布滿足要求。
我們在頒獎典禮結(jié)束后,于太平洋時間~凌晨1點(澳大利亞東部標(biāo)準(zhǔn)時間下午6點)宣布。從來沒有人要求我們晚于此宣布。
最重要的是,我們很高興與世界分享我們的進展和成果。AI推理能力正在快速發(fā)展,這些IMO結(jié)果確實表明了這一點。
通過這件事,我們不難發(fā)現(xiàn),這場AI登上數(shù)學(xué)奧林匹克舞臺的較量,不只是一次技術(shù)競賽,更是一場關(guān)于規(guī)范、節(jié)奏與合作精神的展示。DeepMind選擇了等待官方認(rèn)可,再謹(jǐn)慎發(fā)布成績,贏得了金牌,也贏得了尊重。而OpenAI盡管也取得了不俗成果,卻因時機與方式的問題,引發(fā)了爭議。這背后提醒我們,在通往AGI的路上,除了技術(shù)力,如何與人類社會的規(guī)則與價值觀對齊,正變得愈發(fā)重要。
https://x.com/polynoamial/status/1947398536577822798
https://venturebeat.com/ai/google-deepmind-makes-ai-history-with-gold-medal-win-at-worlds-toughest-math-competition/
古言醫(yī)妃文,不輸《醫(yī)妃傾天下》,強推阿彩的《帝凰之神醫(yī)棄妃》
免責(zé)聲明:本文內(nèi)容由開放的智能模型自動生成,僅供參考。