DECO*27 - Cherry Pop feat. Hatsune Miku
“我或曾夢(mèng)見,與你親密無間”【弗洛洛原創(chuàng)PV】
21世紀(jì)經(jīng)濟(jì)報(bào)道記者鄧浩上海報(bào)道
自從年初DeepseekR1開源模型“掀桌”以來,接入Deepseek成為幾乎所有下游AI應(yīng)用廠商的選擇,甚至有部分資本市場(chǎng)人士感嘆大模型的戰(zhàn)爭(zhēng)已經(jīng)結(jié)束了。
事實(shí)果然如此嗎?
7月26日,大模型六小虎之一的MiniMax創(chuàng)始人、CEO閆俊杰在2025世界人工智能大會(huì)(WAIC)首日的主題演講上給出了自己的回答,“我們認(rèn)為,AI領(lǐng)域一定會(huì)有多個(gè)玩家持續(xù)存在?!?/p>
在閆俊杰看來,AI一定會(huì)被掌握在多家公司的手中,其中有不少可以自洽的邏輯。
首先,由于所有模型,都依賴對(duì)齊(ModelAlignment),模型不同,對(duì)齊目標(biāo)也會(huì)不一樣。其舉例稱,有的模型對(duì)齊目標(biāo)是一個(gè)靠譜的程序員,那么做Agent就會(huì)特別的強(qiáng);有的模型它對(duì)齊目標(biāo)是與人的交互,那么它就會(huì)比較有情商,能夠做流暢的對(duì)話;有的模型可能會(huì)充滿想象力。因此,這或許可以給模型帶上屬于開發(fā)者自己的價(jià)值觀和思想偏好。
其次,閆俊杰透露,MiniMax最近半年用的AI系統(tǒng)其實(shí)都已經(jīng)不是單個(gè)模型了,而是一個(gè)多Agent系統(tǒng),里面涉及多個(gè)模型,不同的模型也可以使用不同的工具,通過這樣的方式讓AI智能水平越來越高,能夠解決越來越復(fù)雜的問題?!斑@個(gè)東西帶來的結(jié)果是,單一模型的優(yōu)勢(shì)在這樣一個(gè)多Agent系統(tǒng)里逐漸變?nèi)??!?/p>
最后,閆俊杰認(rèn)為是過去一年開源模型如雨后春筍般涌現(xiàn),開源模型變得越來越有影響力。最好的開源模型越來越多,同時(shí)也在不斷逼近最好的閉源模型。
無獨(dú)有偶,不久前,月之暗面推出了KimiK2基礎(chǔ)大模型,并且選擇了開源,引發(fā)資本市場(chǎng)的一波熱炒。華西證券評(píng)價(jià)稱,相較過去的基座模型,K2更強(qiáng)調(diào)代碼能力和通用Agent任務(wù)能力。在多個(gè)標(biāo)準(zhǔn)測(cè)試集下,具備與OpenAI和Anthropic旗下大模型接近的能力。
6月,MiniMax已經(jīng)推出了號(hào)稱世界上第一個(gè)開源的大規(guī)模混合架構(gòu)的推理模型MiniMax-M1,被業(yè)內(nèi)視為面對(duì)DeepSeekR1強(qiáng)勁競(jìng)爭(zhēng)給出的回應(yīng)。
在以閃電注意力機(jī)制為主的混合架構(gòu)幫助下,MiniMax推算,在生成長(zhǎng)度為10萬tokens的場(chǎng)景下,MiniMax-M1的計(jì)算量(FLOPs)為DeepSeekR1的25%,在長(zhǎng)文本處理任務(wù)中具備顯著優(yōu)勢(shì)。
成本節(jié)約則更具優(yōu)勢(shì),在進(jìn)行8萬Token的深度推理時(shí),M1所需的算力僅為DeepSeekR1的約30%;生成10萬token時(shí),只需要后者的25%。
一個(gè)有趣的觀察是,在過去一年半,業(yè)內(nèi)可使用算力顯著增加的情況下,AI模型的大小卻沒有發(fā)生特別大的變化,比如前述的KimiK2總參數(shù)達(dá)到1T,激活參數(shù)為32B。
閆俊杰認(rèn)為,原因在于對(duì)所有實(shí)用模型而言,計(jì)算速度是一個(gè)比較關(guān)鍵的因素。如果模型計(jì)算速度特別慢,就會(huì)降低用戶的使用意愿,所以所有公司都關(guān)注模型的參數(shù)量和智能水平之間的平衡。
此外,閆俊杰判斷,通過大量的計(jì)算網(wǎng)絡(luò)系統(tǒng)和優(yōu)化算法,在接下來一兩年之內(nèi),最好模型的推理成本可能還能再降低一個(gè)數(shù)量級(jí)。進(jìn)而其認(rèn)為訓(xùn)練單個(gè)模型的成本不會(huì)顯著地增加。
不過,盡管技術(shù)演進(jìn)優(yōu)化或許可以讓AI研發(fā)不再那么燒錢,但是算力使用可能還會(huì)繼續(xù)飛速增長(zhǎng)。
閆俊杰透露,“盡管Token會(huì)變得很便宜,但是使用Token的數(shù)量會(huì)顯著增加。去年ChatBot單個(gè)對(duì)話只要消耗幾千個(gè)Token,現(xiàn)在Agent單個(gè)對(duì)話可能消耗幾百萬個(gè)Token,并且因?yàn)锳I解決的問題越來越復(fù)雜,越來越實(shí)用,那么用的人也會(huì)越來越多?!?/p>
小說:財(cái)閥老公強(qiáng)勢(shì)奪愛——七日禁錮,五年后重逢,她成了他的掌心寶!
言情小說《財(cái)閥老公強(qiáng)勢(shì)奪愛》為什么 一枝獨(dú)秀到如今?
超越《財(cái)閥老公強(qiáng)勢(shì)奪愛》,夜神翼這部文爆火,9.7分逆襲登頂!