金磊發(fā)自凹非寺量子位|公眾號(hào)QbitAI
谷歌拿下IMO(國際數(shù)學(xué)奧林匹克競(jìng)賽)金牌的模型——Gemini2.5DeepThink,現(xiàn)在可以用起來了。
根據(jù)谷歌DeepMind的最新消息,這個(gè)模型已經(jīng)在GeminiApp中推出。
并且這個(gè)發(fā)布的版本,跟拿下IMO金牌的版本還有略微的區(qū)別。
之前的模型需要好幾個(gè)小時(shí)才能解決復(fù)雜的數(shù)學(xué)問題,但App中發(fā)布的版本,速度會(huì)更快,實(shí)用性也會(huì)更強(qiáng)。
但相對(duì)的,實(shí)力定然不如之前的“完全體”,不過同樣是拿IMO’25的試題實(shí)驗(yàn),可以達(dá)到銅牌的水平。
DeepMind在發(fā)布Gemini2.5DeepThink之際,還拉來了數(shù)學(xué)家MichelvanGarrel來站臺(tái):
當(dāng)我問它一個(gè)猜想,我大概有三個(gè)思路,但它似乎在考慮20甚至100個(gè)
不過這個(gè)模型只對(duì)Ultra的訂閱用戶開放,每月訂閱費(fèi)為249.99美元,折合人民幣約1803元。
推理性能超越o3、Grok4
除了“發(fā)布”的動(dòng)作之外,DeepMind這次還秀了一波推理性能的肌肉,對(duì)標(biāo)的選手是OpenAI的o3和馬斯克的Grok4。
主要考量的能力聚焦在了編碼、科學(xué)、知識(shí)和推理能力上。
結(jié)果顯示,在衡量代碼性能的LiveCodeBenchV6測(cè)試中,以及在衡量不同領(lǐng)域(包括科學(xué)和數(shù)學(xué))專業(yè)知識(shí)的Humanity’sLastExam測(cè)試中,與不使用工具的其他模型相比,Gemini2.5DeepThink均取得最好的成績(jī)。
整體來看,Gemini2.5DeepThink功能具備以下優(yōu)勢(shì):
迭代式開發(fā)與設(shè)計(jì):DeepMind團(tuán)隊(duì)對(duì)DeepThink在需要逐步構(gòu)建復(fù)雜事物的任務(wù)中的表現(xiàn)印象深刻。例如,DeepThink能夠提升網(wǎng)頁開發(fā)任務(wù)的美觀性和功能性。
科學(xué)與數(shù)學(xué)領(lǐng)域的發(fā)現(xiàn):由于能夠通過極其復(fù)雜的難題進(jìn)行推理,深度思考能夠成為研究人員的強(qiáng)大工具。它能夠協(xié)助制定和探索數(shù)學(xué)猜想,或者對(duì)復(fù)雜的科學(xué)文獻(xiàn)進(jìn)行推理分析,從而有可能加快發(fā)現(xiàn)的過程。算法開發(fā)與代碼編寫:DeepThink在處理那些需要精心編寫代碼、對(duì)問題表述、權(quán)衡利弊以及時(shí)間復(fù)雜度進(jìn)行仔細(xì)考量的難題方面表現(xiàn)尤為出色。
至于其背后的原理,DeepMind總結(jié)了一句話:
擴(kuò)展Gemini的并行“思考時(shí)間”。
具體而言,正如人類在解決復(fù)雜問題時(shí),會(huì)花時(shí)間從不同角度探索、權(quán)衡潛在的解決方案并完善最終答案一樣,DeepThink通過使用并行思維技術(shù),拓展了思維能力的邊界。
這種方法讓Gemini能夠一次性生成眾多想法并同時(shí)進(jìn)行考量,甚至隨著時(shí)間的推移修正或結(jié)合不同的想法,最終得出最佳答案。
此外,通過延長(zhǎng)推理時(shí)間或“思考時(shí)間”,DeepMind為Gemini提供了更多時(shí)間去探索不同的假設(shè),并為復(fù)雜問題找到創(chuàng)造性的解決方案。
DeepMind還開發(fā)了新穎的強(qiáng)化學(xué)習(xí)技術(shù),旨在激勵(lì)模型利用這些擴(kuò)展的推理路徑,從而使DeepThink隨著時(shí)間的推移,成為一個(gè)更出色、更直觀的問題解決者。
團(tuán)隊(duì)成員還表示,Gemini2.5DeepThink用來看論文:
它不只是簡(jiǎn)單地復(fù)述研究論文,而是能以我前所未見的方式,融合不同論文中的觀點(diǎn)。
參考鏈接:[1]https://blog.google/products/gemini/gemini-2-5-deep-think/[2]https://x.com/SamuelAlbanie/status/1951322935198630356
小編精選《我就是賣豬肉的》開篇就想入坑,讓人回味不會(huì)讓你失望的!
王者模擬戰(zhàn):養(yǎng)豬?呵呵,我就是賣豬肉的!這套陣容殺豬非常輕松
我要讓人一看我的樣子,就知道我是賣豬肉的。哈哈哈哈哈