本文來源:時代財(cái)經(jīng)作者:郭美婷
“2019年,我們還在討論單點(diǎn)突破的語言模型;到2025年的今天,大模型已呈現(xiàn)‘周級迭代’的爆發(fā)態(tài)勢?!痹赪AIC2025上,阿里云副總裁、大數(shù)據(jù)和智能實(shí)驗(yàn)室負(fù)責(zé)人葉杰平表示,當(dāng)前AI模型技術(shù)正經(jīng)歷從“漸進(jìn)式創(chuàng)新”到“指數(shù)級躍遷”的轉(zhuǎn)變。
在今年WAIC的展區(qū)里,阿里巴巴(09988.HK;BABA.NYSE)展示了從AI基礎(chǔ)設(shè)施到大模型再到平臺及應(yīng)用的“全棧AI”能力,陳列了云原生CPU芯片倚天710、飛天云計(jì)算操作系統(tǒng)、智算集群網(wǎng)絡(luò)架構(gòu)HPN7.0架構(gòu)、AIStack一體機(jī)等底層硬核技術(shù),通義千問及通義萬相大模型系列,以及阿里云百煉、人工智能平臺PAI等大模型平臺和夸克、釘釘?shù)華I應(yīng)用。
圖源:企業(yè)供圖
這其中,包括最新開源的三款大模型:千問3最新版基礎(chǔ)模型(非思考版)、千問3推理模型、AI編程模型Qwen3-Coder。值得注意的是,這三款模型均是在一周內(nèi)宣布開源。
AI賽道上,阿里巴巴正在“狂奔”。按照預(yù)算,未來三年,這家巨頭還將投入3800億元,主要用于建設(shè)云和AI硬件基礎(chǔ)設(shè)施,總額超過去十年總和。
一周內(nèi)開源三款模型
“三年前,我們發(fā)布了通義大模型,并承諾將核心模型開源開放。如今,通義千問已實(shí)現(xiàn)全尺寸、全模態(tài)的全面開源,真正打破了開源與閉源模型之間的技術(shù)壁壘?!比~杰平稱。
開源一直是阿里云發(fā)展AI的主題詞,這一思路在今年由DeepSeek翻起的開源浪潮下愈發(fā)得到驗(yàn)證。
據(jù)了解,千問3最新版基礎(chǔ)模型(非思考版)性能有顯著提升,在GPQA(知識)、AIME25(數(shù)學(xué))、LiveCodeBench(編程)、Arena-Hard(人類偏好對齊)、BFCL(Agent能力)等測評中表現(xiàn)超越Claude4(Non-thinking)等閉源模型。
千問3推理模型支持256K上下文長度,在知識(SuperGPQA)、編程(LiveCodeBenchv6)、數(shù)學(xué)(AIME25)、人類偏好對齊(Arena-Hardv2)、創(chuàng)意寫作(WritingBench)、多語言能力(MultilF)等核心能力上,千問3推理模型可比肩Gemini-2.5pro、o4-mini等閉源模型。
AI編程模型Qwen3-Coder則是千問系列模型中首個采用混合專家MoE架構(gòu)的代碼模型,總參數(shù)達(dá)480B,激活35B參數(shù),原生支持256Ktoken的上下文并可擴(kuò)展至1M長度,能幫助程序員完成基礎(chǔ)編程任務(wù),比如寫代碼、補(bǔ)全代碼、修Bug等。
海外模型API聚合平臺OpenRouter數(shù)據(jù)顯示,上述三大模型開源后,阿里千問API調(diào)用量暴漲,三天突破1000億Tokens,熱度超越GPT、Gemini、Claude等模型,千問包攬OpenRouter趨勢榜前三名。截至目前,通義千問在全球主要模型社區(qū)的下載量已經(jīng)突破4億,衍生模型突破14萬個。
阿里云百煉高級產(chǎn)品專家徐志遠(yuǎn)在接受時代財(cái)經(jīng)等采訪時談到,千問系列模型在誕生之初就面向全球市場而非局限于國內(nèi)市場。國內(nèi)市場方面,依托國內(nèi)龐大的市場空間以及阿里云自身的公共云基礎(chǔ)產(chǎn)品,阿里云更多通過API服務(wù)或低成本模式為用戶提供支持。而在全球市場,若要參與競爭并實(shí)現(xiàn)模型能力的對比排序,開源是極為重要且有效的方式——它能讓全球開發(fā)者成為反饋主體,提供關(guān)于模型的直接反饋與信息,幫助阿里云準(zhǔn)確判斷模型在全球市場的真實(shí)水平。
事實(shí)上,阿里巴巴在開源上的相關(guān)實(shí)踐獲得海外認(rèn)可也比在國內(nèi)更早。徐志遠(yuǎn)談到,“(在開源過程中)我們收到了全球開發(fā)者的反饋,這類反饋在商業(yè)場景中往往難以如此直接獲取,因?yàn)樵陂_源生態(tài)中,開發(fā)者與我們并無絕對利益綁定,他們的反饋僅基于對模型問題的判斷,供我們參考迭代?!?/p>
20萬開發(fā)者、70萬Agent
阿里云百煉是全鏈路大模型服務(wù)與Agent應(yīng)用開發(fā)平臺,據(jù)介紹,目前已有超20萬開發(fā)者在百煉上開發(fā)了70多萬個Agent。
徐志遠(yuǎn)表示,阿里云百煉目前核心包含三個層面的服務(wù):第一個層面是基礎(chǔ)層,即結(jié)合阿里云廣泛的基礎(chǔ)設(shè)施以及可調(diào)度的AI算力,將模型轉(zhuǎn)化為可供調(diào)用的高性價比、高性能API,也即“modelservice”(模型服務(wù))層。
第二個層面是agent(智能代理)層,在模型服務(wù)層之上,阿里云百煉整合了部分領(lǐng)先的agent框架與架構(gòu),為agent的開發(fā)構(gòu)建提供一整套支持能力。在該層面,阿里云百煉提供包括兼容金融領(lǐng)域主流的ATO協(xié)議、MCP協(xié)議,以及支持阿里全棧自研的agent模型調(diào)度能力等。
第三個層面是AI大模型行業(yè)及領(lǐng)域應(yīng)用層。在阿里云百煉上,開發(fā)者通過agent搭建基礎(chǔ)能力后,可進(jìn)一步構(gòu)建一系列行業(yè)及領(lǐng)域應(yīng)用。目前,電力、互聯(lián)網(wǎng)、醫(yī)療、金融等行業(yè),均已基于相關(guān)能力構(gòu)建出面向企業(yè)內(nèi)部及企業(yè)客戶的各類應(yīng)用。
據(jù)徐志遠(yuǎn)介紹,在阿里云百煉服務(wù)的企業(yè)中,其中一個核心場景是多元異構(gòu)復(fù)雜數(shù)據(jù)的處理。他舉例解釋,在如招聘平臺等互聯(lián)網(wǎng)平臺上,每天會產(chǎn)生大量視頻、音頻、文檔等,企業(yè)需要通過不同模態(tài)模型將內(nèi)容轉(zhuǎn)化為所需數(shù)據(jù),并對這些內(nèi)容進(jìn)行結(jié)構(gòu)化提取、入庫、向量化或打標(biāo),以便用于下游的推薦匹配、分析解析等業(yè)務(wù)場景。
第二類是企業(yè)內(nèi)部助理相關(guān)的應(yīng)用,面向企業(yè)員工、內(nèi)部子部門等提升生產(chǎn)效率。其他應(yīng)用場景還包括以圖搜圖、以視頻搜視頻、IPC(網(wǎng)絡(luò)攝像機(jī))等。例如,過去的IPC只有攝像頭組件,僅具備記錄功能,無法自主分析。而如今多模態(tài)模型不斷發(fā)展,尤其是輕量化多模態(tài)模型的出現(xiàn),尺寸更小,使得大量上游廠商可以在IPC中內(nèi)置多模態(tài)模型,讓設(shè)備能基于監(jiān)控畫面快速判斷是否存在異常。今年3月,阿里巴巴就與KUMEROS咖啡達(dá)成戰(zhàn)略合作,為后者提供從門店運(yùn)營到產(chǎn)品創(chuàng)新的全鏈路解決方案。
徐志遠(yuǎn)進(jìn)一步補(bǔ)充,具體到百煉服務(wù)企業(yè)客戶,目前頭部是互聯(lián)網(wǎng)行業(yè),這是因?yàn)榇罅炕ヂ?lián)網(wǎng)公司本身就以新技術(shù)驅(qū)動業(yè)務(wù)增長;其次是新消費(fèi)行業(yè),如咖啡門店等能在小程序等用戶觸點(diǎn)中融入AI能力,幫助用戶更好地完成消費(fèi),還依托自身基礎(chǔ)設(shè)施在內(nèi)部業(yè)務(wù)中落地相關(guān)應(yīng)用。
徐志遠(yuǎn)還著重提到了消費(fèi)電子領(lǐng)域,未來多模態(tài)組件等融入模型后,如AI玩具等AI消費(fèi)設(shè)備有望實(shí)現(xiàn)增長?!敖谖覀円呀?jīng)看到該行業(yè)涌現(xiàn)出大量需求,也正在做豐富的適配工作,以提升消費(fèi)電子行業(yè)對模型的應(yīng)用能力?!毙熘具h(yuǎn)說。
延伸閱讀:與 {利用衛(wèi)星}遙:感火眼金睛 中國團(tuán)隊(duì)精準(zhǔn)量化全球垃圾;填埋場甲烷排放 的相關(guān)文章