21世紀經濟報道記者鄧浩上海報道
自從年初DeepseekR1開源模型“掀桌”以來,接入Deepseek成為幾乎所有下游AI應用廠商的選擇,甚至有部分資本市場人士感嘆大模型的戰(zhàn)爭已經結束了。
事實果然如此嗎?
7月26日,大模型六小虎之一的MiniMax創(chuàng)始人、CEO閆俊杰在2025世界人工智能大會(WAIC)首日的主題演講上給出了自己的回答,“我們認為,AI領域一定會有多個玩家持續(xù)存在。”
在閆俊杰看來,AI一定會被掌握在多家公司的手中,其中有不少可以自洽的邏輯。
首先,由于所有模型,都依賴對齊(ModelAlignment),模型不同,對齊目標也會不一樣。其舉例稱,有的模型對齊目標是一個靠譜的程序員,那么做Agent就會特別的強;有的模型它對齊目標是與人的交互,那么它就會比較有情商,能夠做流暢的對話;有的模型可能會充滿想象力。因此,這或許可以給模型帶上屬于開發(fā)者自己的價值觀和思想偏好。
其次,閆俊杰透露,MiniMax最近半年用的AI系統(tǒng)其實都已經不是單個模型了,而是一個多Agent系統(tǒng),里面涉及多個模型,不同的模型也可以使用不同的工具,通過這樣的方式讓AI智能水平越來越高,能夠解決越來越復雜的問題?!斑@個東西帶來的結果是,單一模型的優(yōu)勢在這樣一個多Agent系統(tǒng)里逐漸變弱。”
最后,閆俊杰認為是過去一年開源模型如雨后春筍般涌現,開源模型變得越來越有影響力。最好的開源模型越來越多,同時也在不斷逼近最好的閉源模型。
無獨有偶,不久前,月之暗面推出了KimiK2基礎大模型,并且選擇了開源,引發(fā)資本市場的一波熱炒。華西證券評價稱,相較過去的基座模型,K2更強調代碼能力和通用Agent任務能力。在多個標準測試集下,具備與OpenAI和Anthropic旗下大模型接近的能力。
6月,MiniMax已經推出了號稱世界上第一個開源的大規(guī)?;旌霞軜嫷耐评砟P蚆iniMax-M1,被業(yè)內視為面對DeepSeekR1強勁競爭給出的回應。
在以閃電注意力機制為主的混合架構幫助下,MiniMax推算,在生成長度為10萬tokens的場景下,MiniMax-M1的計算量(FLOPs)為DeepSeekR1的25%,在長文本處理任務中具備顯著優(yōu)勢。
成本節(jié)約則更具優(yōu)勢,在進行8萬Token的深度推理時,M1所需的算力僅為DeepSeekR1的約30%;生成10萬token時,只需要后者的25%。
一個有趣的觀察是,在過去一年半,業(yè)內可使用算力顯著增加的情況下,AI模型的大小卻沒有發(fā)生特別大的變化,比如前述的KimiK2總參數達到1T,激活參數為32B。
閆俊杰認為,原因在于對所有實用模型而言,計算速度是一個比較關鍵的因素。如果模型計算速度特別慢,就會降低用戶的使用意愿,所以所有公司都關注模型的參數量和智能水平之間的平衡。
此外,閆俊杰判斷,通過大量的計算網絡系統(tǒng)和優(yōu)化算法,在接下來一兩年之內,最好模型的推理成本可能還能再降低一個數量級。進而其認為訓練單個模型的成本不會顯著地增加。
不過,盡管技術演進優(yōu)化或許可以讓AI研發(fā)不再那么燒錢,但是算力使用可能還會繼續(xù)飛速增長。
閆俊杰透露,“盡管Token會變得很便宜,但是使用Token的數量會顯著增加。去年ChatBot單個對話只要消耗幾千個Token,現在Agent單個對話可能消耗幾百萬個Token,并且因為AI解決的問題越來越復雜,越來越實用,那么用的人也會越來越多?!?/p>
重生軍婚寵愛文:丫頭別哭了,誰欺負你了,我?guī)湍闫圬摶貋砗貌缓?/p>《重生復仇千金》作者:點點紫雨點擊下方小卡片即可免費閱讀全文一想到重生,那么她的仇,是不是表示可以親自報呢? 一想到此,雙手緊緊的捏在一起,一股強大的殺氣從她的身上溢了出來,凡是對不起她的人,她一定會一個一個的親手送他們下地獄。她會笑著看他們哭……重活一世,她就是為復仇而來_——。上官幽你安心的去吧,以后由我是什么。 第三本:《重生復仇千金》作者:點點紫雨【推薦指數】:★★★☆ 【內容節(jié)選】:四人女人在大廳之中,小聲的咒罵起來,二樓的拐角處,上官幽的身子隱在黑暗之中,幽深的眸子瞇了起來,看著四個得意洋洋的四人,不由的搖了搖頭,原本她只是想給她們一點教訓,可以現在竟然找來混混,想毀了她,更加想讓她身敗還有呢?