「滿血版」斬獲IMO2025金牌,谷歌最強Gemini2.5DeepThink正式上線!
只需每月支付250美元,即可通過GeminiUltra訂閱計劃使用。
Gemini2.5DeepThink主打「多智能體推理」,可生成多個智能體并發(fā)進(jìn)行推理。
雖然這一方法會消耗更多計算資源,但能極大提升AI推理的精準(zhǔn)性。
1.多智能體系統(tǒng)首次公開:Gemini2.5DeepThink是谷歌首個對公眾開放的多智能體模型。其核心機制是并行生成多個智能體思考路徑,從中篩選最優(yōu)答案,盡管耗能更大,但推理效果顯著提升。
2.數(shù)學(xué)奧賽金牌驗證:谷歌曾使用DeepThink變體參加2025年國際數(shù)學(xué)奧林匹克(IMO),并獲得金牌。
3.發(fā)布版達(dá)到銅牌級別:發(fā)布版本速度更快,日常使用更加便捷,同時在內(nèi)部評估中基于2025年IMO基準(zhǔn)測試仍能達(dá)到銅牌水平的表現(xiàn)。
4.學(xué)術(shù)版模型首次釋放:谷歌也將當(dāng)時用于IMO的版本開放給少數(shù)數(shù)學(xué)家和學(xué)者測試,該模型推理過程耗時數(shù)小時,目標(biāo)是提升研究能力與反饋機制。
5.性能全面領(lǐng)先:·在Humanity’sLastExam(HLE)中,Gemini2.5DeepThink取得34.8%的高分,領(lǐng)先xAI的Grok4(25.4%)和OpenAI的o3(20.3%)?!ぴ诖a挑戰(zhàn)LiveCodeBench6上,Gemini也以87.6%超越Grok4(79%)與o3(72%)。
6.工具整合與響應(yīng)增強:Gemini2.5DeepThink可自動配合代碼執(zhí)行和谷歌搜索等工具,谷歌表示其能夠生成比傳統(tǒng)AI模型「更長的回復(fù)」。
Gemini2.5DeepThink模型特點:
·支持輸入類型:文本(如問題、提示、待總結(jié)的文檔)、圖像、音頻、視頻·上下文窗口長度:最大可接受100萬(1M)tokens長度的上下文?!ぽ敵鲱愋团c長度:輸出文本形式內(nèi)容、最大輸出長度可達(dá)192Ktokens
此前,為了爭奪「首個」拿下IMO金牌的模型,OpenAI「不講武德」,在沒有經(jīng)過組委會同意的情況下「搶先發(fā)布」消息。
這次在GPT-5發(fā)布前夕,谷歌率先Gemini2.5DeepThink。
你覺得谷歌Gemini2.5DeepThink能截胡GPT-5嗎?
《小城》——墨宇夢溪
姚卿文小說集《夢也何曾到謝橋》之《小城》(三)
傳統(tǒng)地方戲引入現(xiàn)代故事,淮劇《小城》心靈叩問發(fā)人深省