在這個(gè)夏季,沉寂已久的大模型競技場再度沸騰,各路豪杰紛紛亮劍,爭奪技術(shù)巔峰。
世界人工智能大會(huì)(WAIC)成為了這場戰(zhàn)役的最新戰(zhàn)場。其中,階躍星辰、智譜以及阿里巴巴成為了最為引人注目的三方勢力。7月25日,階躍星辰率先推出了最新的多模態(tài)推理模型Step-3,而阿里巴巴緊隨其后,發(fā)布了通義千問3推理模型Qwen3-235B-A22B。僅僅三天后,智譜也不甘示弱,推出了最新一代基座大模型GLM-4.5。阿里巴巴更是火力全開,在同一天內(nèi)還開源了通義萬相2.2,涵蓋了多種視頻生成模態(tài)。
這場競爭的火藥味十足。阿里巴巴在發(fā)布通義千問3時(shí),便冠以“全球最強(qiáng)”之名。然而,三天后,智譜的GLM-4.5便以新王的姿態(tài),在綜合性能榜單上奪得了全球第三的位置,將通義千問3擠到了第九。智譜的一名員工透露,算法團(tuán)隊(duì)在緊張地關(guān)注著通義千問的更新,直到GLM-4.5在多個(gè)測評(píng)集中取得優(yōu)異成績,大家才松了一口氣。
WAIC上的硝煙只是這兩個(gè)月以來六小虎模型混戰(zhàn)的一個(gè)縮影。早在6月,MiniMax便在為期五天的發(fā)布日中,推出了在上下文長度和工具使用場景中領(lǐng)先的推理模型M1,以及創(chuàng)造了海外爆款視頻的視頻生成模型Hailuo2。而僅僅一個(gè)月后,月之暗面的新開源推理模型K2便以橫掃之勢,奪得了24項(xiàng)開源模型的SOTA。
在這場激烈的競爭中,轉(zhuǎn)型后的百川智能和零一萬物卻選擇了沉默,缺席了WAIC以及新一輪的模型混戰(zhàn)。自DeepSeekV3、R1發(fā)布后,六小虎中的這兩家公司在市場上已經(jīng)沉寂了近半年。高管離職、人才出走也成為了常態(tài)。據(jù)脈脈的一份報(bào)告顯示,截至7月初,六小虎中有超過四成的員工都在尋找新的機(jī)會(huì)。
在后DeepSeek時(shí)代,這場戰(zhàn)役對(duì)于六小虎能否重回舞臺(tái)中央,甚至關(guān)乎其存亡。這份成績單將極大程度影響公司后續(xù)的資本操作和商業(yè)化進(jìn)展。更重要的是,在經(jīng)歷了市場口碑下滑、內(nèi)部軍心渙散的半年之后,六小虎急需一場勝利來向內(nèi)外證明自己仍有留在大模型牌桌上的實(shí)力。
然而,后DeepSeek時(shí)代的模型戰(zhàn)役依然充滿挑戰(zhàn)。DeepSeekR1的掀桌之舉證明了,要想一鳴驚人,不僅性能要好,還得搶占先機(jī)。K2的訓(xùn)練從2024年末便開始籌備,本計(jì)劃在2025年中旬發(fā)布,然而R1的搶先發(fā)布卻搶走了本可能屬于K2的榮光。為了防守,月之暗面不得不先釋出帶有遺憾的版本K1.5,但市場反響并不如人意。不過,K2發(fā)布后的好口碑,也在某種程度上撫平了被DeepSeek搶先的創(chuàng)傷。
同樣主打Coding和Agentic能力的智譜也感受到了K2帶來的壓力。為了打贏推理模型的SOTA之戰(zhàn),GLM-4.5的訓(xùn)練花費(fèi)了將近三個(gè)月的時(shí)間。智譜甚至在多智能體任務(wù)上放棄了一貫的Dense路線,改用了MOE架構(gòu)。然而,月之暗面的保密工作做得太好,智譜在K2發(fā)布當(dāng)天才知道其技術(shù)細(xì)節(jié)。智譜在最后一個(gè)月緊急加訓(xùn),硬是把GLM-4.5的Coding和Agentic能力在測評(píng)集上提升到了與K2相當(dāng)?shù)某潭取?/p>
如今,賽場上幾家大模型公司針鋒相對(duì),重回了舞臺(tái)中心。與2023年行業(yè)“重參數(shù)、搞閉源”的普遍風(fēng)氣不同,如今的中國模型已經(jīng)更加注重技術(shù)口碑。自DeepSeek起勢后,開源和放出技術(shù)報(bào)告成為了六小虎發(fā)布模型的標(biāo)配。開發(fā)者成為了模型的第一批用戶,開源成為了大模型觸達(dá)開發(fā)者的關(guān)鍵。如今,開發(fā)者都聚集在HuggingFace、GitHub等平臺(tái)上,模型廠商只需將開源鏈接發(fā)布在這些平臺(tái)上便能吸引大量關(guān)注。
即便經(jīng)歷了動(dòng)蕩的半年,六小虎依然擁有遠(yuǎn)超普通創(chuàng)業(yè)公司的資金和人才儲(chǔ)備。在這一輪模型混戰(zhàn)中,六小虎雖然沒有收獲碾壓性的成績,但各有各的亮點(diǎn)。MiniMax坐穩(wěn)了視頻生成的頭部位置;KimiK2和GLM-4.5先后奪得推理模型的SOTA;階躍星辰的Step-3則領(lǐng)跑了多模態(tài)這一小眾賽道。雖然沒有絕對(duì)的贏家,但經(jīng)歷這一輪模型混戰(zhàn)后,六小虎在全球模型戰(zhàn)場上幾乎都擁有了姓名。
模型開放平臺(tái)OpenRouter的統(tǒng)計(jì)顯示,KimiK2在全球模型調(diào)用量排行榜上位居第六,而GLM-4.5在發(fā)布當(dāng)天就沖上了第二十的位置。MiniMax發(fā)布Hailuo2后,其下載量也猛增。點(diǎn)點(diǎn)數(shù)據(jù)顯示,HailuoAI在7月22日的單日下載量達(dá)到了11萬。
上岸的四小虎獲得了繼續(xù)游戲的續(xù)命符。MiniMax在連續(xù)五天發(fā)布模型和產(chǎn)品后,傳來了籌備IPO的消息。階躍星辰在發(fā)布會(huì)上也宣布了一筆來自上海國投等機(jī)構(gòu)的超5億美元融資,以及年?duì)I收目標(biāo)達(dá)到10億元。然而,模型之戰(zhàn)還遠(yuǎn)未決出勝者。在“中國不需要這么多的基座模型”這一共識(shí)下,六小虎在模型之戰(zhàn)中尚未走到可以安心的時(shí)刻。新一輪的淘汰賽才剛剛開始,大廠可以輕松Allin多個(gè)模型方向,而六小虎卻難以兼顧。
重生末日,蘇晨囤積萬億物資,誓要獨(dú)活成狠人!
末日狠人歸來,開局囤萬億物資,誓做末世之神
重生末世前,蘇晨囤萬億物資,誓做最強(qiáng)狠人