撰文|郝鑫
編輯|吳先之
大模型也不得不脫下孔乙己的長衫。
在鄉(xiāng)親們的第一堂AI工具課上,盡管他們不知道騰訊元寶為何物,但表現(xiàn)得極為踴躍,“能勸和婆媳吵架不”“娃不肯結婚咋辦”。就在幾百米外,墻上剛刷上“母豬產后護理,問騰訊元寶”的廣告語。
阿里通義千問也跟養(yǎng)豬較上了勁兒,從體溫檢測、飼料配比到疾病預警,號稱要用算法掌控每只豬的一生。在同一片土地上,有人利用通義千問開發(fā)“農業(yè)農村法律政策”大模型,還有人在通義千問的基礎之上精調出“水稻種業(yè)”大模型。
各行各業(yè)對大模型的渴望遠超想象,開源的DeepSeek和Qwen成為了主要的推動力量之一。據統(tǒng)計,2025年上半年,有196個超10萬元的DeepSeek政企項目在全國鋪開。沒有花活兒,“DeepSeek+Qwen”落地教育、醫(yī)療、政務等領域成為了最優(yōu)解。
從城市實驗室到農村田頭,通義千問們“下鄉(xiāng)”的背后,一方面充斥著大模型公司驗證場景和商業(yè)化路線的急迫性,另一方面也擠滿了怕被時代拋棄的人們。
中國大模型有專屬于自己的道路,既要躋身于一流,也要接地氣兒。進一步可拆解為,在國際榜單上Kill對手,在業(yè)務上吃掉客戶。
榜單無限游戲
大模型哪家強,榜單成績說了算。
DeepSeek-R1的出圈給了人們最直觀的感受,中國大模型也揚眉吐氣了一回,有底氣和OpenAI、Anthropic這類絕對頭部一決高下。
DeepSeek用低成本和高效率,實現(xiàn)了R1在數學、代碼自然語言推理等任務上,性能比肩OpenAIo1正式版,DeepSeek-R1也由此成為了衡量國內大模型的“試金石”。
阿里通義千問早在2023年就走上了開源的路線,擁有國內最全尺寸、模態(tài)的大模型全家桶和完備的生態(tài)。從最初對標LIama系列到超越DeepSeek-R1和OpenAIo1,開源的阿里Qwen3迎來了自己的高光時刻。
今年4月29日,阿里正式開源通義千問模型Qwen3,其參數量僅為DeepSeek-R1的1/3,部署成本僅是滿血版R1的25%-35%。在模型部署成本大幅降低六到七成的情況下,Qwen3超越了R1、OpenAI-o1等全球頂尖模型。
Qwen3在推理、指令遵循、工具調用、多語言能力等方面均大幅增強,創(chuàng)下當時所有國產模型及全球開源模型的性能新高。
具體來看,在奧數水平的AIME25測評中,Qwen3斬獲81.5分,刷新開源紀錄;在考察代碼能力的LiveCodeBench評測中,Qwen3突破70分大關,表現(xiàn)甚至超過Grok3;在評估模型人類偏好對齊的ArenaHard測評中,Qwen3以95.6分超越了OpenAI-o1及DeepSeek-R1。
可以說,在一段時間內,Qwen3順利完成了DeepSeek-R1的接棒。我們了解到,很多企業(yè)面臨無法激活滿血版R1的情況,因此全尺寸、全模態(tài)的Qwen3系列成為了落地場景的選擇。更多情況下,企業(yè)選擇兩者都要,Qwen3與R1優(yōu)勢互補,被打包進垂類場景解決方案里。
據智能超參數統(tǒng)計發(fā)現(xiàn),性能突出且開源的DeepSeek、Qwen等開源大模型的出現(xiàn),一定程度上改變了金融機構的采購重心,給大模型ToB行業(yè)帶來了改變。此外,DeepSeek、Qwen開源后,還導致了算力采購需求的激增,這都從側面證明了模型能力的重要性。
聚光燈之外,對標OpenAI,通義千問還做了很多動作來彌補Qwen3的不足:通義實驗室RAG團隊開源了WebDancer模型,可從零訓練一個DeepResearch類智能體;開源WebSailor模型,增強網頁檢索和復雜推理能力。
榜單即戰(zhàn)場,“紅皇后效應”日益凸顯,為了保持排名,玩家必須不斷奔跑。DeepSeek-R2蓄勢待發(fā),沉寂已久的MiniMax和Kimi緊隨其后。模型榜單排名游戲似乎沒有終點,技術迭代、榜單擴容、評測維度變化,讓“第一”的頭銜永遠只是暫時的勝利。
市場份額之爭
在大模型技術迭代放緩之前,榜單仍有存在的價值。當下而言,大模型榜單排名直接影響AI公司的融資估值和客戶信任度。
榜單算得上大模型的第一張名片,背后直接關系到大模型市場份額的競爭。據一篇關于“2025年上半年大模型API市場數據分析帖子”,大模型市場份額方面,谷歌以43.1%的份額穩(wěn)居第一,DeepSeek和Anthropic分別以19.6%和18.4%的份額占比位列第二和第三。
谷歌“量大管飽”“全覆蓋”的策略,令其在市場(特別是文本翻譯領域)占據了絕對優(yōu)勢。DeepSeek雖屬于后起之秀,但在開源、性能優(yōu)勢的加持下快速追趕了上來,自DeepSeek-V3發(fā)布以來,一直保持著一定的市場份額,并且在持續(xù)擴大。
Qwen3因為比DeepSeek慢了一步,沒有吃下這波開源的紅利。截至今年上半年,通義千問(Qwen)系列模型僅占據了1.6%的市場份額。
DeepSeek的市場份額擴大,似乎表明大模型的競爭格局尚未成型。即只要模型得到市場認可,就有可能與巨頭抗衡,今天是DeepSeek,明天就有可能是通義千問。
這也解釋了MiniMax、Kimi舉公司之力突破和開源最新大模型能力的原因,這些公司也想吃下一部分大模型細分市場份額。成為OpenAI、谷歌的“高仿”也在考慮范圍內,比如最近就已經有開發(fā)者用KimiK2模型來替代Claude4的某些功能,其核心優(yōu)勢就在于免費、開源。
比起創(chuàng)業(yè)公司的單點爆破,國內通義千問的贏面或許更大。大模型市場份額比拼的是長期競爭力,無論是開源還是閉源,大模型能力都得保持一直更新中,稍有不慎就面臨著掉隊的風險。
一個典型的例子是LIama,LIama2、LIama3此前在開源社區(qū)聲量很高,但后期模型能力差強人意,被同樣開源的DeepSeek取而代之。MiniMax、Kimi等公司缺乏持續(xù)開槍的彈藥,受IPO的壓力,也許很難保證連續(xù)性的突破式創(chuàng)新。接下來中國大模型市場份額的競爭,角逐者仍鎖定在DeepSeek和通義千問之間。
魔搭開發(fā)者大會上,通義千問負責人林俊旸透露,通義千問將繼續(xù)在強化學習方向探索,從大模型訓練時代邁入智能體訓練時代。多模態(tài)是其中一個重點方向,Qwen下一代VLo已經在路上,目前已有一些階段性進展,多模態(tài)模型的生成和理解統(tǒng)一是現(xiàn)在的目標。
大模型下沉
大模型燒錢換來榜單的一席之地,最后總得有人來買單。
現(xiàn)在模型廠商推進商業(yè)化路線大致有兩種。
一種是拿下各行業(yè)大客戶,打造標桿,以此來吸引同行業(yè)其他潛在群體。阿里通義大模型已經服務了商業(yè)銀行、互聯(lián)網公司、手機品牌、家電龍頭、高校及科研院所、汽車行業(yè)等客戶。
另一種是做ToB定制化單子,主要面向政企類客戶,交付包括算力、大模型、智能體應用在內的一體化解決方案。
以上兩種路徑的共同點是,由通義方來主導,自上而下地推動大模型落地。同時,光子星球注意到,除了頭部大客戶外,大模型下沉的趨勢越來越明顯,不少團隊正在主動集成通義千問大模型,在此基礎上落地應用。
“農法千問”大模型是以農業(yè)農村法律政策為主要內容的AI大模型,通過集成通義千問技術,將晦澀法規(guī)轉化為方言問答,來提升農民法律意識。同樣在農業(yè)領域還有相關論文在討論,通義千問參與設計灌溉系統(tǒng)、土壤改良方案的可行性。
此外,在河南、重慶等地的鄉(xiāng)村,百度千帆平臺正推動“大模型下鄉(xiāng)”計劃,幫助村民便捷處理醫(yī)保繳費、戶籍辦理等瑣碎事務。還有一些城市和縣域,研究AI公務員上崗、大模型種植荔枝和AI養(yǎng)豬,這些是比鄉(xiāng)下“刷墻”更實在的大模型滲透方式。
總體而言,中國大模型已經走過了炫技和參數比拼的時代,剩下的只有解決一個個行業(yè)問題。
互聯(lián)網大廠的下沉市場競爭由來已久。
阿里曾在2017年推出ET農業(yè)大腦技術,將AI與農業(yè)深度結合,形成從生豬養(yǎng)殖到經濟作物的全場景解決方案。在“熱土計劃2024”中加大投入、提供專項基金,聯(lián)合多方共建鄉(xiāng)村可持續(xù)發(fā)展實驗室。在此基礎上,大模型全線向下滲透不過是時間問題。
對下沉市場而言,中國模型具有本土優(yōu)勢。在中文語境、方言理解上的本土化能力,比國際模型更適配縣域需求。一些輕量化模型和MoE架構降低部署成本,更適合于算力薄弱地區(qū)。在這個過程中,通過與G端和B端企業(yè)的合作,還能撬動C端應用入口的下沉,讓“母豬產后護理,問騰訊元寶”不再流于口號。
大模型的商業(yè)化之路,正從高懸的“技術神壇”走向廣袤的田間地頭。
榜單排名競爭固然重要,但未來大模型的價值將在,用方言解讀法律條文的村口,在AI測算灌溉流量的水渠邊。
微信號|TMTweb
公眾號|光子星球
別忘了掃碼關注我們!
為什么經濟越不好,娛樂越火?看看現(xiàn)實有多殘酷!
經濟越冷他越火!吳彥祖直播賣英語課,40分鐘銷售超百萬,賺麻了
短視頻如何助力年輕人實現(xiàn)經濟獨立并影響生活