吳琳偉
「滿血版」斬獲IMO2025金牌,谷歌最強Gemini2.5DeepThink正式上線!
只需每月支付250美元,即可通過GeminiUltra訂閱計劃使用。
Gemini2.5DeepThink主打「多智能體推理」,可生成多個智能體并發(fā)進(jìn)行推理。
雖然這一方法會消耗更多計算資源,但能極大提升AI推理的精準(zhǔn)性。
1.多智能體系統(tǒng)首次公開:Gemini2.5DeepThink是谷歌首個對公眾開放的多智能體模型。其核心機制是并行生成多個智能體思考路徑,從中篩選最優(yōu)答案,盡管耗能更大,但推理效果顯著提升。
2.數(shù)學(xué)奧賽金牌驗證:谷歌曾使用DeepThink變體參加2025年國際數(shù)學(xué)奧林匹克(IMO),并獲得金牌。
3.發(fā)布版達(dá)到銅牌級別:發(fā)布版本速度更快,日常使用更加便捷,同時在內(nèi)部評估中基于2025年IMO基準(zhǔn)測試仍能達(dá)到銅牌水平的表現(xiàn)。
4.學(xué)術(shù)版模型首次釋放:谷歌也將當(dāng)時用于IMO的版本開放給少數(shù)數(shù)學(xué)家和學(xué)者測試,該模型推理過程耗時數(shù)小時,目標(biāo)是提升研究能力與反饋機制。
5.性能全面領(lǐng)先:·在Humanity’sLastExam(HLE)中,Gemini2.5DeepThink取得34.8%的高分,領(lǐng)先xAI的Grok4(25.4%)和OpenAI的o3(20.3%)。·在代碼挑戰(zhàn)LiveCodeBench6上,Gemini也以87.6%超越Grok4(79%)與o3(72%)。
6.工具整合與響應(yīng)增強:Gemini2.5DeepThink可自動配合代碼執(zhí)行和谷歌搜索等工具,谷歌表示其能夠生成比傳統(tǒng)AI模型「更長的回復(fù)」。
Gemini2.5DeepThink模型特點:
·支持輸入類型:文本(如問題、提示、待總結(jié)的文檔)、圖像、音頻、視頻·上下文窗口長度:最大可接受100萬(1M)tokens長度的上下文?!ぽ敵鲱愋团c長度:輸出文本形式內(nèi)容、最大輸出長度可達(dá)192Ktokens
此前,為了爭奪「首個」拿下IMO金牌的模型,OpenAI「不講武德」,在沒有經(jīng)過組委會同意的情況下「搶先發(fā)布」消息。
這次在GPT-5發(fā)布前夕,谷歌率先Gemini2.5DeepThink。
你覺得谷歌Gemini2.5DeepThink能截胡GPT-5嗎?
穿進(jìn)熱血漫卻只配當(dāng)柔弱先知?她馬甲全開,虐哭全漫粉!
這個世界的大部分區(qū)域都被兇獸占據(jù)了,海洋、森林、湖泊、河流、山巒、鄉(xiāng)鎮(zhèn)、縣城、縣級市幾乎全都淪為了兇獸的棲息地,人類只能躲在基地市內(nèi)茍且偷生?;厥胁哦啻??還要養(yǎng)活那么多人口!所以,基地市的土地可以用寸土寸金來形容,普通人只能擠在政府建造的廉租房里蹉跎度日——。獨棟別墅?想都別想!想住獨棟別墅,不好了吧!
小說:重生游戲開服前,獲SSS天賦百倍反傷,虐哭全服!
“額,阿虎哥。我這不是受傷了不記得以前的事情了么,這不能怪我啊?!绷衷綖榱烁斓牧私膺@個世界只能裝作在森林里受傷失憶。不然要是讓他們知道他是從另外一個世界穿越而來的,估計會被當(dāng)作異類吧,甚至被抓去研究都有可能。阿牛駕著獸車在路上左拐右拐的行駛了大概十分鐘左右,林越一行人終于到達(dá)了城主府。
小說:穿越平行世界捉迷藏,我開掛虐哭追捕者!
“這次,我要的東西,我一定會捏在手里?!标懡难凵?,變得堅定無比。墻壁上的電子鐘一分一秒走著__。20:00——。時間到,《神話》開啟--。守在游戲艙前的陸江第一時間進(jìn)入艙內(nèi)|。但陸江沒有立馬就去游戲里創(chuàng)建角色。而是在艙內(nèi)找到了一個隱藏按鈕,按下后才進(jìn)入游戲。隱藏模式,這是至尊游戲艙才有的,而且會在說完了——。
來源:紅網(wǎng)
作者:野越澤
編輯:虞林
本文為紅辣椒評論 原創(chuàng)文章,僅系作者個人觀點,不代表紅網(wǎng)立場。轉(zhuǎn)載請附原文出處鏈接和本聲明。