網(wǎng)紅「旺仔小喬」被禁言禁關(guān),公開道歉信被指查重率達 97%,后續(xù)事態(tài)會怎樣發(fā)展?
「滿血版」斬獲IMO2025金牌,谷歌最強Gemini2.5DeepThink正式上線!
只需每月支付250美元,即可通過GeminiUltra訂閱計劃使用。
Gemini2.5DeepThink主打「多智能體推理」,可生成多個智能體并發(fā)進行推理。
雖然這一方法會消耗更多計算資源,但能極大提升AI推理的精準性。
1.多智能體系統(tǒng)首次公開:Gemini2.5DeepThink是谷歌首個對公眾開放的多智能體模型。其核心機制是并行生成多個智能體思考路徑,從中篩選最優(yōu)答案,盡管耗能更大,但推理效果顯著提升。
2.數(shù)學奧賽金牌驗證:谷歌曾使用DeepThink變體參加2025年國際數(shù)學奧林匹克(IMO),并獲得金牌。
3.發(fā)布版達到銅牌級別:發(fā)布版本速度更快,日常使用更加便捷,同時在內(nèi)部評估中基于2025年IMO基準測試仍能達到銅牌水平的表現(xiàn)。
4.學術(shù)版模型首次釋放:谷歌也將當時用于IMO的版本開放給少數(shù)數(shù)學家和學者測試,該模型推理過程耗時數(shù)小時,目標是提升研究能力與反饋機制。
5.性能全面領(lǐng)先:·在Humanity’sLastExam(HLE)中,Gemini2.5DeepThink取得34.8%的高分,領(lǐng)先xAI的Grok4(25.4%)和OpenAI的o3(20.3%)。·在代碼挑戰(zhàn)LiveCodeBench6上,Gemini也以87.6%超越Grok4(79%)與o3(72%)。
6.工具整合與響應(yīng)增強:Gemini2.5DeepThink可自動配合代碼執(zhí)行和谷歌搜索等工具,谷歌表示其能夠生成比傳統(tǒng)AI模型「更長的回復(fù)」。
Gemini2.5DeepThink模型特點:
·支持輸入類型:文本(如問題、提示、待總結(jié)的文檔)、圖像、音頻、視頻·上下文窗口長度:最大可接受100萬(1M)tokens長度的上下文?!ぽ敵鲱愋团c長度:輸出文本形式內(nèi)容、最大輸出長度可達192Ktokens
此前,為了爭奪「首個」拿下IMO金牌的模型,OpenAI「不講武德」,在沒有經(jīng)過組委會同意的情況下「搶先發(fā)布」消息。
這次在GPT-5發(fā)布前夕,谷歌率先Gemini2.5DeepThink。
你覺得谷歌Gemini2.5DeepThink能截胡GPT-5嗎?