加沙的孩子即將被餓死,BIBI認(rèn)為漢堡王比麥當(dāng)勞好吃
當(dāng)MC服里加入秦始皇騎北極熊(玩家:你撫琵琶奏琴弦,我坐戲子樓臺(tái)前???????
深度|| 九九功成,統(tǒng)治階層的合影,天地不全的缺憾
媒體稱 NASA 發(fā)現(xiàn)一顆富含黃金的小行星,估值 5.53 億億元,這意味著什么?這些黃金能被人類所用嗎?
金磊發(fā)自凹非寺量子位|公眾號(hào)QbitAI
谷歌拿下IMO(國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽)金牌的模型——Gemini2.5DeepThink,現(xiàn)在可以用起來(lái)了。
根據(jù)谷歌DeepMind的最新消息,這個(gè)模型已經(jīng)在GeminiApp中推出。
并且這個(gè)發(fā)布的版本,跟拿下IMO金牌的版本還有略微的區(qū)別。
之前的模型需要好幾個(gè)小時(shí)才能解決復(fù)雜的數(shù)學(xué)問(wèn)題,但App中發(fā)布的版本,速度會(huì)更快,實(shí)用性也會(huì)更強(qiáng)。
但相對(duì)的,實(shí)力定然不如之前的“完全體”,不過(guò)同樣是拿IMO’25的試題實(shí)驗(yàn),可以達(dá)到銅牌的水平。
DeepMind在發(fā)布Gemini2.5DeepThink之際,還拉來(lái)了數(shù)學(xué)家MichelvanGarrel來(lái)站臺(tái):
當(dāng)我問(wèn)它一個(gè)猜想,我大概有三個(gè)思路,但它似乎在考慮20甚至100個(gè)
不過(guò)這個(gè)模型只對(duì)Ultra的訂閱用戶開(kāi)放,每月訂閱費(fèi)為249.99美元,折合人民幣約1803元。
推理性能超越o3、Grok4
除了“發(fā)布”的動(dòng)作之外,DeepMind這次還秀了一波推理性能的肌肉,對(duì)標(biāo)的選手是OpenAI的o3和馬斯克的Grok4。
主要考量的能力聚焦在了編碼、科學(xué)、知識(shí)和推理能力上。
結(jié)果顯示,在衡量代碼性能的LiveCodeBenchV6測(cè)試中,以及在衡量不同領(lǐng)域(包括科學(xué)和數(shù)學(xué))專業(yè)知識(shí)的Humanity’sLastExam測(cè)試中,與不使用工具的其他模型相比,Gemini2.5DeepThink均取得最好的成績(jī)。
整體來(lái)看,Gemini2.5DeepThink功能具備以下優(yōu)勢(shì):
迭代式開(kāi)發(fā)與設(shè)計(jì):DeepMind團(tuán)隊(duì)對(duì)DeepThink在需要逐步構(gòu)建復(fù)雜事物的任務(wù)中的表現(xiàn)印象深刻。例如,DeepThink能夠提升網(wǎng)頁(yè)開(kāi)發(fā)任務(wù)的美觀性和功能性。
科學(xué)與數(shù)學(xué)領(lǐng)域的發(fā)現(xiàn):由于能夠通過(guò)極其復(fù)雜的難題進(jìn)行推理,深度思考能夠成為研究人員的強(qiáng)大工具。它能夠協(xié)助制定和探索數(shù)學(xué)猜想,或者對(duì)復(fù)雜的科學(xué)文獻(xiàn)進(jìn)行推理分析,從而有可能加快發(fā)現(xiàn)的過(guò)程。算法開(kāi)發(fā)與代碼編寫(xiě):DeepThink在處理那些需要精心編寫(xiě)代碼、對(duì)問(wèn)題表述、權(quán)衡利弊以及時(shí)間復(fù)雜度進(jìn)行仔細(xì)考量的難題方面表現(xiàn)尤為出色。
至于其背后的原理,DeepMind總結(jié)了一句話:
擴(kuò)展Gemini的并行“思考時(shí)間”。
具體而言,正如人類在解決復(fù)雜問(wèn)題時(shí),會(huì)花時(shí)間從不同角度探索、權(quán)衡潛在的解決方案并完善最終答案一樣,DeepThink通過(guò)使用并行思維技術(shù),拓展了思維能力的邊界。
這種方法讓Gemini能夠一次性生成眾多想法并同時(shí)進(jìn)行考量,甚至隨著時(shí)間的推移修正或結(jié)合不同的想法,最終得出最佳答案。
此外,通過(guò)延長(zhǎng)推理時(shí)間或“思考時(shí)間”,DeepMind為Gemini提供了更多時(shí)間去探索不同的假設(shè),并為復(fù)雜問(wèn)題找到創(chuàng)造性的解決方案。
DeepMind還開(kāi)發(fā)了新穎的強(qiáng)化學(xué)習(xí)技術(shù),旨在激勵(lì)模型利用這些擴(kuò)展的推理路徑,從而使DeepThink隨著時(shí)間的推移,成為一個(gè)更出色、更直觀的問(wèn)題解決者。
團(tuán)隊(duì)成員還表示,Gemini2.5DeepThink用來(lái)看論文:
它不只是簡(jiǎn)單地復(fù)述研究論文,而是能以我前所未見(jiàn)的方式,融合不同論文中的觀點(diǎn)。
參考鏈接:[1]https://blog.google/products/gemini/gemini-2-5-deep-think/[2]https://x.com/SamuelAlbanie/status/1951322935198630356
山川江河的震撼景象與磅礴氣勢(shì)
贊美祖國(guó)山河壯美的佳句
精品七言絕句《志壯山河》,這首詩(shī)夠不夠狂?還能寫(xiě)出更狂的詩(shī)嗎