新智元報道
KingHZ桃子
【新智元導(dǎo)讀】九天基礎(chǔ)大模型3.0震撼發(fā)布!在2025世界人工智能大會上,九天基礎(chǔ)大模型端到端技術(shù)全面升級,性能飆升35%,智能體調(diào)用效率提升21%,15Ttoken預(yù)訓(xùn)練,還是全國產(chǎn)!
7月26日,在2025世界人工智能大會期間,中國移動煥新發(fā)布「九天」基礎(chǔ)大模型3.0。
本次發(fā)布的「九天」基礎(chǔ)大模型3.0,重點聚焦模型的端到端技術(shù)升級以及生成可控性能力的增強,進一步強化九天大模型「高安全、高可控、全國產(chǎn)、全行業(yè)」的獨特優(yōu)勢。
端到端升級,九天眾擎性能大躍升
九天眾擎語言大模型1.0于2023年10月發(fā)布,實現(xiàn)了大模型數(shù)據(jù)構(gòu)建、預(yù)訓(xùn)練、微調(diào)、推理等全鏈路核心技術(shù)自主研發(fā),是首個通過國家網(wǎng)信辦雙備案的央企大模型。
九天眾擎語言大模型2.0于2024年7月發(fā)布,創(chuàng)新提出基于稀疏專家混合語言架構(gòu),模型參數(shù)及訓(xùn)練數(shù)據(jù)均有飛躍性提升,預(yù)訓(xùn)練階段采用了5萬億Token數(shù)據(jù),此外,還引入了10%的行業(yè)知識數(shù)據(jù)。
本次發(fā)布的語言大模型3.0在架構(gòu)、數(shù)據(jù)、后訓(xùn)練、算力適配等方面實現(xiàn)了升級和技術(shù)創(chuàng)新。
架構(gòu)方面,突破性采用業(yè)界領(lǐng)先的MoE(MixtureofExperts)架構(gòu),通過并行優(yōu)化、混精計算優(yōu)化、權(quán)重去冗余優(yōu)化、構(gòu)建自動故障恢復(fù)程序、框架快速編譯與編譯緩存、全局集合通信域異步創(chuàng)建及算子通信預(yù)建鏈等技術(shù)創(chuàng)新,解決了大模型解決算法精度溢出、非確定性計算誤差、檢查點存儲慢、稀疏模型訓(xùn)練效率低下等問題。
數(shù)據(jù)方面,預(yù)訓(xùn)練數(shù)據(jù)總規(guī)模擴增到15Ttoken,采用了多階段配比方式:在第一階段學(xué)習(xí)海量知識,第二階段用高質(zhì)量數(shù)據(jù)重點提升數(shù)學(xué)推理等各種專項能力,第三階段(退火階段)用長文數(shù)據(jù)和更高質(zhì)量數(shù)據(jù)進行能力上的進一步爬坡。
在高質(zhì)量數(shù)據(jù)方面,對數(shù)學(xué)、邏輯推理、代碼、專業(yè)知識等重點領(lǐng)域進行了大幅增強,在數(shù)據(jù)上實現(xiàn)了簡潔回答與長思維鏈深度思考的有機結(jié)合。
此外,還構(gòu)建了覆蓋全流程的數(shù)據(jù)治理體系技術(shù)架構(gòu),涵蓋多源異構(gòu)語料采集、深度清洗與標注等關(guān)鍵環(huán)節(jié),還集成了敏感度檢測、動態(tài)資源調(diào)度等核心能力,能夠?qū)崿F(xiàn)多語言、多文化、多地域表達的高質(zhì)量覆蓋,特別是在復(fù)雜語境與稀缺資源條件下具備顯著優(yōu)勢。
后訓(xùn)練方面,在數(shù)據(jù)篩選階段,核心創(chuàng)新在于構(gòu)建了包含113域×53能力的「二維分級」數(shù)據(jù)體系,并系統(tǒng)性應(yīng)用了基于「質(zhì)量/難度/多樣性/必要性」的四維篩選準則;
在數(shù)據(jù)合成階段,創(chuàng)新性地提出層級原則體系,實現(xiàn)從安全到高級文風(fēng)再到模型個性的多維度精準指導(dǎo),同時設(shè)計了數(shù)據(jù)驅(qū)動原則歸納方法及動態(tài)應(yīng)用機制,從高質(zhì)量數(shù)據(jù)中自動提煉隱形規(guī)則,助力九天模型從機械式檢索進化為能輸出商業(yè)洞察與情感共鳴的智能助手;
在強化學(xué)習(xí)階段,設(shè)計了一種多階段的強化學(xué)習(xí)訓(xùn)練方法,創(chuàng)新性地結(jié)合了動態(tài)溫度調(diào)節(jié)、難度自適應(yīng)的數(shù)據(jù)更新機制以及上下文窗口逐步擴展策略,實現(xiàn)了在長期訓(xùn)練過程中的穩(wěn)定性保障與模型能力的持續(xù)提升。
算力適配方面,九天眾擎語言大模型3.0實現(xiàn)了在算子、框架、模型三個層面的全棧國產(chǎn)適配,實現(xiàn)了與11家芯片廠商17款國產(chǎn)AI芯片的適配,在研發(fā)期間共解決了200+個芯片硬件、集群、算子、算法框架中的缺陷,完成60項算子和訓(xùn)練算法方面的優(yōu)化。
通過多維度的端到端技術(shù)升級,模型的復(fù)雜推理能力較上一代提升35%,智能體調(diào)用效率提升21%,實現(xiàn)了性能的跨越式進步。
在IFEval評測中,「九天」以88.61分超越其他模型,在MMLU-Pro測評中,以71.41分超越Qwen3,在ArenaHardV0.1測評中,以91.4分超越DeepSeekV3。
性能躍升的同時,九天眾擎語言大模型以「高可控智能體」為核心,構(gòu)建了覆蓋知識問答、角色服務(wù)、流程控制的全鏈路解決方案。在知識問答層面,具有低幻覺文檔問答能力,通過深度語義解析精準捕捉用戶意圖,依托真實文檔實現(xiàn)有據(jù)回復(fù),確保信息生成的真實性與可靠性。
角色扮演服務(wù)場景中,模型聚焦沉浸式角色演繹,深度解析角色背景信息與SOP服務(wù)流程,基于深度推理能力模擬角色思考邏輯,顯著提升客戶交互的真實感與專業(yè)度。
在業(yè)務(wù)流程控制環(huán)節(jié),九天眾擎語言大模型支持自然語言、偽代碼、Mermaid等多種方式描述業(yè)務(wù)規(guī)范流程,嚴格遵守既定工作流程與API接口協(xié)作規(guī)則,靈活應(yīng)對多嵌套、多分支的復(fù)雜任務(wù),有效規(guī)避「規(guī)劃幻覺」風(fēng)險,保障業(yè)務(wù)流程執(zhí)行的確定性與可控性。
基于最新的語言大模型,中國移動此次也推出多個專項大模型。九天代碼大模型使用兩階段的持續(xù)訓(xùn)練技術(shù),支持代碼生成、注釋生成、單元測試生成、代碼智能問答等多種任務(wù),支持Python、Java、JS、TS、Go、C++等10+種主流編程語言。
性能方面,在LivecodeBenchv5、BFCLV3等代碼生成榜單成績超越Qwen3及DeepSeekV3。
九天代碼大模型可快速實現(xiàn)HTML頁面設(shè)計:
九天數(shù)學(xué)大模型,在短思考、長思考模式均達到業(yè)界SOTA水平,在MATH500及AIME2024測評任務(wù)中指標超越Qwen3。
九天大模型數(shù)學(xué)推理方面表現(xiàn)出色,能夠準確理解數(shù)學(xué)問題的核心邏輯,并運用多種方法進行推理和驗證,精準地給出答案。
本題推導(dǎo)了Shor算法進行質(zhì)因數(shù)分解時,量子傅里葉變換后的量子態(tài)坍縮概率分布公式,模型基于周期性態(tài)和量子傅里葉變換的數(shù)學(xué)性質(zhì)計算測量結(jié)果的概率
高可控視覺生成,九天善智多模態(tài)能力煥新
九天善智多模態(tài)大模型全面提升生成可控性,基于復(fù)雜時空建模、流匹配圖片視頻漸進式聯(lián)合訓(xùn)練、端到端局部可控注意力機制等創(chuàng)新,同時引入多模態(tài)理解信息提升對文本指令和輸入條件圖像視頻的感知能力,聯(lián)合圖文交織數(shù)據(jù)訓(xùn)練,實現(xiàn)既能生成高質(zhì)量的圖像視頻,又能進行多輪對話式高可控精確編輯操作,顯著提升了視覺生成的靈活便利性。
在圖片生成功能方面,可支持多輪精準局部修改,如修改文字、修改背景、增加元素等。如「生成一張公交站牌,站牌上寫著『5G』的圖片」。
將5G替換為6G
站牌旁邊停著一輛公交車
旁邊還有一輛摩托車
改成涂鴉風(fēng)格
圖片動起來
在視頻生成功能方面,構(gòu)建統(tǒng)一可控生成體系,視頻生成可控性進一步增強,支持基于個體軌跡控制的視頻生成,視頻續(xù)寫,基于運鏡控制的視頻生成以及視頻編輯能力。
針對基于個體軌跡控制的視頻生成,提出層次化運動建模與動態(tài)特征對齊技術(shù),突破長程依賴建模難題。
創(chuàng)新性地利用運動向量解耦與三模態(tài)協(xié)同控制技術(shù),實現(xiàn)支持亞像素級路徑和適配多曲率運動軌跡的視頻軌跡控制能力。
基于運鏡控制的視頻生成技術(shù),利用語義信息解耦和時序條件注入,并通過引入相機姿態(tài)信息,模擬真實物理世界成像規(guī)律,實現(xiàn)對生成視頻運鏡的精準控制。
視頻編輯能力創(chuàng)新性引入自適應(yīng)編輯模塊和結(jié)構(gòu)化噪聲設(shè)計,有效提升用戶指令跟隨能力,保證編輯前后運動以及非編輯區(qū)域的視覺一致性。
視頻編輯-刪除操作
視頻編輯-替換操作
多模態(tài)大模型在圖理解和視頻理解方面的性能表現(xiàn)也全面提升。圖理解方面,采用了token-mixing策略與視覺重采樣方案,巧妙地平衡了全局感知和細粒度感知能力,使得模型在處理更高分辨率的輸入圖像時,依然能保持出色的性能表現(xiàn),進而實現(xiàn)了綜合能力的顯著提升。
在MMStar、HallusionBench和OCRBench等圖理解任務(wù)中,九天模型分別獲得了82.2、64.3和94.9的高分,OpenCompass綜合評分79.5分,領(lǐng)先其他大部分模型。
視頻理解方面,九天模型設(shè)計金字塔型記憶庫結(jié)構(gòu)和多層漸進式的視覺token融合方案,兼顧視頻流中的時間和空間信息,提升模型對于長時視覺信號的理解能力。
在Videomme任務(wù)中表現(xiàn)優(yōu)秀,超越Qwen2-VL和GPT-4o,在MVbench任務(wù)領(lǐng)先其余模型。
8月6日開始,九天將開展一系列技術(shù)直播,重點解析九天基礎(chǔ)大模型、開源模型及數(shù)據(jù)集,鎖定「九天人工智能」視頻號,獲取最新技術(shù)干貨。
附錄
九天開源模型和評測體系下載鏈接
1.數(shù)學(xué)大模型:JT-Math-8B系列模型
煥新社區(qū)地址(下載方式見文末):
JT-Math-8B-Instruct:
https://aihuanxin.cn/#/model?path=/model/detail/1463
JT-Math-8B-Thinking:
https://aihuanxin.cn/#/model?path=/model/detail/1464
JT-Math-8B-Base:
https://aihuanxin.cn/#/model?path=/model/detail/1459
Huggingface地址:
https://huggingface.co/JT-LM/JT-Math-8B-Base
https://huggingface.co/JT-LM/JT-Math-8B-Instruct
https://huggingface.co/JT-LM/JT-Math-8B-Thinking
ModelScope地址:
https://www.modelscope.cn/models/JiuTian-AI/JT-Math-8B-Instruct
https://www.modelscope.cn/models/JiuTian-AI/JT-Math-8B-Base
https://www.modelscope.cn/models/JiuTian-AI/JT-Math-8B-Thinking
github地址:
https://github.com/JT-LM/JT-Math-8B
gitee地址:
https://gitee.com/CMCC-jiutian/jt-math-8b.git
2.代碼大模型:JT-Coder-8B系列模型
煥新社區(qū)地址(下載方式見文末):
JT-Coder-8B-Instruct:
https://aihuanxin.cn/#/model?path=/model/detail/1458
JT-Coder-8B-Base:
https://aihuanxin.cn/#/model?path=/model/detail/1466
Huggingface地址:
https://huggingface.co/JT-LM/JT-Coder-8B-Base
https://huggingface.co/JT-LM/JT-Coder-8B-Instruct
ModelScope地址:
https://www.modelscope.cn/models/JiuTian-AI/JT-Coder-8B-Base
https://www.modelscope.cn/models/JiuTian-AI/JT-Coder-8B-Instruct
煥新社區(qū)開源獲取方式:
進入煥新社區(qū)(aihuanxin.cn),進入模型庫/數(shù)據(jù)集,選擇組織【九天人工智能】,快速獲取九天最新開源內(nèi)容。