文/熊逾格
編輯/陳鋒
7月末,上海世博展覽館人潮如織,2025WAIC迎來史無前例的熱度。
科技盛宴背后,2025年以來,國內(nèi)大模型產(chǎn)業(yè)的三大趨勢愈發(fā)清晰,競爭版圖正在重塑:
推理模型成為新的技術制高點;應用落地從概念走向?qū)崙?zhàn);國產(chǎn)算力迎來突破性進展。
從DeepSeek的開源風暴到華為昇騰384超節(jié)點的首次亮相,從“六小虎”的差異化布局到巨頭的全面反擊,大模型正告別“百模大戰(zhàn)”的混沌期,步入更加理性而激烈的“中場戰(zhàn)事”。
WAIC2025現(xiàn)場,圖源世界人工智能大會官方微信公眾號
我們看到,2025WAIC上,在去年顯得低調(diào)的機器人產(chǎn)業(yè)變得火熱,相關公司由2024年的18家劇增到80家,占領幾乎整個展館二層H3展館,火熱非凡。而大模型廠商們則主要集中在一層H1展館。
今年,“AI六小虎”中的零一萬物、百川智能并未現(xiàn)身,BAT、科大訊飛等頭部廠商展位不再專注比拼模型參數(shù),而是展示出多樣的落地生態(tài)。
如今,大模型競爭已不再是單純的技術軍備競賽,而是一場關乎產(chǎn)業(yè)生態(tài)、商業(yè)模式和國際競爭力的綜合較量。當大模型從實驗室走向產(chǎn)業(yè)一線,推理能力成為新的分水嶺,國產(chǎn)化成為不可逆轉(zhuǎn)的趨勢,每一個參與者都在重新審視自己的定位和實力。
1、一場推理模型的“百花齊放”
如果說2025年以前的“百模大戰(zhàn)”更多是在基礎能力上的比拼,推理模型則代表了從“能回答”到“會思考”的質(zhì)的飛躍。
這一轉(zhuǎn)折點的標志性事件,無疑是DeepSeek-R1的橫空出世。
據(jù)業(yè)內(nèi)分析,DeepSeek-R1的訓練成本僅為560萬美元,遠低于美國AI公司的數(shù)千萬美元乃至數(shù)億美元投入。更重要的是,這一技術突破開啟了推理模型的“平民化”路徑,讓原本高不可攀的AGI研究變得相對可及。
面對變局,頭部廠商迅速跟進。WAIC上推理模型的“百花齊放”,闡釋著大模型競爭規(guī)則的變化。
據(jù)不完全統(tǒng)計,自2025年1月DeepSeek-R1發(fā)布以來,頭部廠商和大模型創(chuàng)業(yè)公司,在在短短數(shù)月內(nèi)相繼推出了自己的推理模型。
3月,騰訊發(fā)布混元T1正式版,百度發(fā)布文心X1;阿里發(fā)布QwQ-32B推理模型;
4月,字節(jié)發(fā)布Seed-Thinking-v1.5;阿里發(fā)布通義千問Qwen3推理模型;
6月,騰訊發(fā)布混元-A13B;
7月,智譜發(fā)布GLM-4.5,階躍星辰發(fā)布Step3,科大訊飛星火X1迎來第二次升級,月之暗面發(fā)布KimiK2。
WAIC2025的騰訊展臺,圖源騰訊優(yōu)圖實驗室官方微信公眾號
WAIC前后,國內(nèi)大模型廠商展示自家最新推理模型,呈現(xiàn)出在技術路線上明顯的差異化策略,主要體現(xiàn)在模型架構(gòu)、推理機制、參數(shù)策略及成本三方面:
首先是架構(gòu)選擇、創(chuàng)新的分野。大模型架構(gòu)從純Transformer走向混合架構(gòu)時代,單一架構(gòu)已無法滿足推理模型的性能需求,混合架構(gòu)成為新的技術制高點。
騰訊的混元T1正式版,摒棄純Transformer架構(gòu),轉(zhuǎn)而將混合Mamba架構(gòu)應用于推理大模型,實際生成速度快于DeepSeek-R1;
月之暗面的KimiK2、阿里的Qwen3推理模型、字節(jié)的Seed-Thinking-v1.5、智譜的GLM-4.5、階躍星辰的Step3均采用MoE架構(gòu)。
其次是推理機制創(chuàng)新,更適合場景應用以及Agent發(fā)展。
百度的文心X1,采用“思維鏈-行動鏈”協(xié)同訓練,在復雜任務中自動拆解為二十多個推理步驟,同時可以調(diào)用十幾種的工具鏈,增強Agent的能力;
科大訊飛的星火X1使用“快思考+慢思考”統(tǒng)一模型架構(gòu),通用推理能力與專業(yè)領域推理并重;
月之暗面的Kimi2主打代碼能力和Agentic任務處理,針對軟件工程任務進行了專門優(yōu)化;
階躍星辰的Step3創(chuàng)新引入MFA注意力機制和AFD分布式推理系統(tǒng);
智譜的GLM-4.5首次在單個模型中實現(xiàn)推理、編碼和智能體能力的原生融合,支持思考模式和非思考模式切換。
最后是參數(shù)策略的強調(diào),在效率、成本、速度之間尋找平衡。
KimiK2擁有32B激活參數(shù)和1T總參數(shù),是目前業(yè)界總參數(shù)量最大的開源模型;
Seed-Thinking-v1.5參數(shù)量降低至200B總參數(shù)和20B激活參數(shù),輕量化趨勢明顯;
阿里QwQ-32B采用32B參數(shù)規(guī)模,顯存需求控制在24GB,大幅降低部署門檻;
騰訊混元A13B總參數(shù)80B、激活參數(shù)僅13B,1張中低端GPU即可部署。
WAIC2025阿里展臺,圖源通義靈碼官方微信公眾號
當下,推理模型的競爭已不再局限于參數(shù)規(guī)模和算力消耗,模型的推理鏈條設計、多步驟邏輯處理能力以及與下游任務的適配性,正成為新的評價維度。
這場推理模型的軍備競賽,實質(zhì)上是各家廠商對未來AI發(fā)展方向的不同押注。開源還是閉源,通用還是專用,效率還是效果,每一個選擇都將決定其在下一階段競爭中的位置。
而隨著推理模型技術的日趨成熟,真正的較量更轉(zhuǎn)向應用場景的爭奪。
2、從B到C,大模型落地拼什么?
在推理模型解決“思考”問題后,應用落地展示出“為誰想”和“想什么”的關鍵方向。2025年的WAIC展會上,最引人注目的變化莫過于大模型從“技術展示”向“應用實戰(zhàn)”的轉(zhuǎn)變。
這一轉(zhuǎn)變首先體現(xiàn)在WAIC廠商策略的分化上——互聯(lián)網(wǎng)巨頭依靠平臺生態(tài)及能力,不斷在B端、C端廣泛布局;專業(yè)模型廠商選擇垂直賽道深化,選擇B端作為突圍出口。
其中,騰訊展示出混元大模型“從云到端”的完整展示鏈路,以及B端金融分析助手、智能視頻剪輯、媒體內(nèi)容生成等內(nèi)容,頗為吸睛的亮點在于社交——在微信中添加“騰訊元寶”好友,能讓14億微信用戶像加好友一樣接觸AI助手。
阿里側(cè)重在AI工具帶給生活的便利性。
比如,通義大模型技術底座支撐下,天貓精靈全屋智能構(gòu)建的空間智能體系,讓用戶現(xiàn)場體驗AI影音搜推、AIK歌、AI健身等豐富場景;通義APP融合AI翻譯、AI對話、AI語音通話三大功能,成為用戶的“貼身伙伴”。
通義千問+釘釘辦公智能體能夠自動生成項目推進表、會議紀要、日報匯總,集成知識庫管理、權(quán)限控制與RPA能力。
百度聚焦百舸GPU算力平臺、“萬源”智能計算操作系統(tǒng)等AI基礎設施,配合文心大模型技術底座,進而推出慧播星、文心快碼、“萬源”智能計算操作系統(tǒng)、AI升級的百度文庫及百度網(wǎng)盤等產(chǎn)品。
WAIC2025百度展臺的網(wǎng)盤、文庫展示,圖源百度網(wǎng)盤服務號官方微信公眾號
另一方面,Kimi、智譜AI等廠商缺乏大廠的流量優(yōu)勢,展示內(nèi)容更加注重B端能力。
其中,Kimi、智譜AI,對標Claude偏向強調(diào)編程、智能體的能力。
智譜AI的CogAgent平臺支持訓練個性化對話體,快速封裝為智能客服、內(nèi)容助手等角色,并擁有私有知識庫、多模態(tài)API與流程自定義等功能。智譜此前表示,GLM-4.5的API價格僅為Claude的1/10,速度可達100tokens/秒。
Kimi推出Kimi-Researcher深度研究智能體,新推出的KimiK2在代碼能力和Agentic任務處理上優(yōu)勢明顯,也能夠完成AI商務寫作+智能表格分析一體化流程。
WAIC2025的kimi演示“AI商務寫作+智能表格分析”一體化流,圖源藍馳創(chuàng)投官方微信公眾號
“六小虎”的其中兩家,Minimax和階躍星辰則更加注重多模態(tài)能力。
階躍星辰新一代多模態(tài)大模型Step3能力覆蓋文字、語音、圖像、視頻、音樂、推理,稱國內(nèi)Top10手機廠商過半都已接入階躍的多模態(tài)能力,OPPO、榮耀、中興的旗艦機型都已搭載適配,合作伙伴還包括吉利汽車、智元機器人等企業(yè),預計2025年全年收入近10億人民幣。
MiniMax的MiniMaxAgent智能體平臺,能夠進行長程復雜任務處理,替代專業(yè)人士一周工作量,深入網(wǎng)頁開發(fā)、深度調(diào)研等垂直領域應用,支持釘釘、飛書、企業(yè)微信等辦公系統(tǒng)集成。
不難看出,在應用形態(tài)上,Agent成為最具想象力的落地方向。
但根植于當下環(huán)境——近期C端通用Agent明星產(chǎn)品Manus總部遷移至新加坡、國內(nèi)裁員80人并放棄國內(nèi)版本上線,大模型廠商們更注重垂直Agent能力的開發(fā)。
以落地場景來說,值得關注的還有大模型在垂直行業(yè)的滲透加速。
例如,在金融領域,風控、投顧、客服等環(huán)節(jié)都在積極引入大模型技術;在醫(yī)療領域,診斷輔助、藥物研發(fā)、病歷管理等應用場景不斷涌現(xiàn);在制造業(yè),智能質(zhì)檢、預測性維護、供應鏈優(yōu)化等用例逐步落地。
綜合來看,大模型的應用落地實際上是一場綜合實力的競賽。
技術能力是基礎,但產(chǎn)品化能力、生態(tài)整合能力、客戶服務能力同樣重要,能夠在這些維度上形成差異化優(yōu)勢的廠商,才有可能在應用落地的競爭中勝出。
3、國產(chǎn)算力曙光乍現(xiàn)
在大模型產(chǎn)業(yè)的所有變量中,算力無疑是最具戰(zhàn)略意義的一環(huán)。
近期,黃仁勛訪華為國產(chǎn)算力發(fā)展提供新的視角。在接受央視采訪時對,黃仁勛表示華為AI芯片取代英偉達或許只是時間問題,也讓人更加期待國產(chǎn)算力的潛力。
據(jù)公開資料,阿里、字節(jié)跳動近幾個月的日均Token調(diào)用量增長相比一年前均接近、超過100倍,這種爆發(fā)式增長對算力供給提出了巨大挑戰(zhàn)。
在2025年的WAIC展會上,國產(chǎn)算力展現(xiàn)出前所未有的實力和信心。
作為“八大鎮(zhèn)館之寶”之一,華為昇騰384超節(jié)點首次實機展出。昇騰384超節(jié)點基于超節(jié)點架構(gòu),通過總線技術實現(xiàn)384個NPU之間的大帶寬低時延互聯(lián),解決集群內(nèi)計算、存儲等各資源之間的通信瓶頸。
WAIC2025的華為昇騰384超節(jié)點,圖源世界人工智能大會微信公眾號
這樣的突破意義不僅在于算力規(guī)模的提升,更在于為國產(chǎn)大模型訓練提供了可靠的底層支撐。
國產(chǎn)GPU廠商的表現(xiàn)同樣令人矚目。燧原科技的新一代人工智能推理加速卡“燧原S60”,對標英偉達L20,搭載了48G顯存和PCIe5.0接口,支持各種主流推理框架和200+主流模型,可滿足千億參數(shù)大模型的推理需求。
在今年2月與美圖旗下美顏相機的合作中,燧原科技僅用4天時間就完成了近萬張推理卡的上線部署,解決“AI換裝”功能爆火帶來的需求。
此外,國產(chǎn)算力還展現(xiàn)出從單點突破轉(zhuǎn)向生態(tài)協(xié)同的趨勢。7月,階躍星辰聯(lián)合華為昇騰、沐曦、壁仞科技、燧原科技、天數(shù)智芯等近10家芯片及基礎設施廠商發(fā)起“模芯生態(tài)創(chuàng)新聯(lián)盟”。
國產(chǎn)算力的發(fā)展仍面臨諸多挑戰(zhàn)。在芯片性能上,國產(chǎn)算力與國際先進水平仍有差距;在軟件生態(tài)上,開發(fā)工具鏈和優(yōu)化算法還需要進一步完善;在大規(guī)模部署上,穩(wěn)定性和可靠性還需要更多驗證。
但我們不妨更加樂觀。技術路徑的多樣化為后發(fā)追趕創(chuàng)造了機會,龐大的國內(nèi)市場為產(chǎn)業(yè)化提供了基礎,政策支持為創(chuàng)新發(fā)展提供了保障。
更重要的是,WAIC上AI產(chǎn)業(yè)呈現(xiàn)出的快速發(fā)展,更讓人看到國產(chǎn)算力發(fā)展的歷史性窗口。
4、結(jié)語
當WAIC的熱潮逐漸退去,大模型產(chǎn)業(yè)的“中場戰(zhàn)事”才剛剛開始。這不再是一場單純的技術競賽,而是涉及技術路徑、商業(yè)模式、生態(tài)建設和國際競爭的全方位較量。
中場戰(zhàn)事的核心特征是分化與聚焦。
分化體現(xiàn)在技術路徑的多元化、應用場景的專業(yè)化和商業(yè)模式的差異化;聚焦則體現(xiàn)在核心技術的攻堅、關鍵應用的突破和生態(tài)護城河的構(gòu)建。
這種變化趨勢預示著大模型產(chǎn)業(yè)正在從高速擴張期進入精耕細作期。
展望未來,三大趨勢將繼續(xù)深化:推理模型將從當前的邏輯推理擴展到多模態(tài)推理和具身智能推理;應用落地將從工具型應用發(fā)展為平臺型應用和生態(tài)型應用;國產(chǎn)算力從追趕模式轉(zhuǎn)向比拼模式,在某些細分領域?qū)崿F(xiàn)領先。
中場戰(zhàn)事的勝負,最終將由應用價值和用戶選擇來裁判。WAIC熱潮落幕后,留在舞臺中心的國內(nèi)大模型產(chǎn)業(yè)路在何方,仍待進一步驗證。