新智元報道
KingHZ桃子
【新智元導讀】九天基礎大模型3.0震撼發(fā)布!在2025世界人工智能大會上,九天基礎大模型端到端技術全面升級,性能飆升35%,智能體調用效率提升21%,15Ttoken預訓練,還是全國產!
7月26日,在2025世界人工智能大會期間,中國移動煥新發(fā)布「九天」基礎大模型3.0。
本次發(fā)布的「九天」基礎大模型3.0,重點聚焦模型的端到端技術升級以及生成可控性能力的增強,進一步強化九天大模型「高安全、高可控、全國產、全行業(yè)」的獨特優(yōu)勢。
端到端升級,九天眾擎性能大躍升
九天眾擎語言大模型1.0于2023年10月發(fā)布,實現了大模型數據構建、預訓練、微調、推理等全鏈路核心技術自主研發(fā),是首個通過國家網信辦雙備案的央企大模型。
九天眾擎語言大模型2.0于2024年7月發(fā)布,創(chuàng)新提出基于稀疏專家混合語言架構,模型參數及訓練數據均有飛躍性提升,預訓練階段采用了5萬億Token數據,此外,還引入了10%的行業(yè)知識數據。
本次發(fā)布的語言大模型3.0在架構、數據、后訓練、算力適配等方面實現了升級和技術創(chuàng)新。
架構方面,突破性采用業(yè)界領先的MoE(MixtureofExperts)架構,通過并行優(yōu)化、混精計算優(yōu)化、權重去冗余優(yōu)化、構建自動故障恢復程序、框架快速編譯與編譯緩存、全局集合通信域異步創(chuàng)建及算子通信預建鏈等技術創(chuàng)新,解決了大模型解決算法精度溢出、非確定性計算誤差、檢查點存儲慢、稀疏模型訓練效率低下等問題。
數據方面,預訓練數據總規(guī)模擴增到15Ttoken,采用了多階段配比方式:在第一階段學習海量知識,第二階段用高質量數據重點提升數學推理等各種專項能力,第三階段(退火階段)用長文數據和更高質量數據進行能力上的進一步爬坡。
在高質量數據方面,對數學、邏輯推理、代碼、專業(yè)知識等重點領域進行了大幅增強,在數據上實現了簡潔回答與長思維鏈深度思考的有機結合。
此外,還構建了覆蓋全流程的數據治理體系技術架構,涵蓋多源異構語料采集、深度清洗與標注等關鍵環(huán)節(jié),還集成了敏感度檢測、動態(tài)資源調度等核心能力,能夠實現多語言、多文化、多地域表達的高質量覆蓋,特別是在復雜語境與稀缺資源條件下具備顯著優(yōu)勢。
后訓練方面,在數據篩選階段,核心創(chuàng)新在于構建了包含113域×53能力的「二維分級」數據體系,并系統(tǒng)性應用了基于「質量/難度/多樣性/必要性」的四維篩選準則;
在數據合成階段,創(chuàng)新性地提出層級原則體系,實現從安全到高級文風再到模型個性的多維度精準指導,同時設計了數據驅動原則歸納方法及動態(tài)應用機制,從高質量數據中自動提煉隱形規(guī)則,助力九天模型從機械式檢索進化為能輸出商業(yè)洞察與情感共鳴的智能助手;
在強化學習階段,設計了一種多階段的強化學習訓練方法,創(chuàng)新性地結合了動態(tài)溫度調節(jié)、難度自適應的數據更新機制以及上下文窗口逐步擴展策略,實現了在長期訓練過程中的穩(wěn)定性保障與模型能力的持續(xù)提升。
算力適配方面,九天眾擎語言大模型3.0實現了在算子、框架、模型三個層面的全棧國產適配,實現了與11家芯片廠商17款國產AI芯片的適配,在研發(fā)期間共解決了200+個芯片硬件、集群、算子、算法框架中的缺陷,完成60項算子和訓練算法方面的優(yōu)化。
通過多維度的端到端技術升級,模型的復雜推理能力較上一代提升35%,智能體調用效率提升21%,實現了性能的跨越式進步。
在IFEval評測中,「九天」以88.61分超越其他模型,在MMLU-Pro測評中,以71.41分超越Qwen3,在ArenaHardV0.1測評中,以91.4分超越DeepSeekV3。
性能躍升的同時,九天眾擎語言大模型以「高可控智能體」為核心,構建了覆蓋知識問答、角色服務、流程控制的全鏈路解決方案。在知識問答層面,具有低幻覺文檔問答能力,通過深度語義解析精準捕捉用戶意圖,依托真實文檔實現有據回復,確保信息生成的真實性與可靠性。
角色扮演服務場景中,模型聚焦沉浸式角色演繹,深度解析角色背景信息與SOP服務流程,基于深度推理能力模擬角色思考邏輯,顯著提升客戶交互的真實感與專業(yè)度。
在業(yè)務流程控制環(huán)節(jié),九天眾擎語言大模型支持自然語言、偽代碼、Mermaid等多種方式描述業(yè)務規(guī)范流程,嚴格遵守既定工作流程與API接口協(xié)作規(guī)則,靈活應對多嵌套、多分支的復雜任務,有效規(guī)避「規(guī)劃幻覺」風險,保障業(yè)務流程執(zhí)行的確定性與可控性。
基于最新的語言大模型,中國移動此次也推出多個專項大模型。九天代碼大模型使用兩階段的持續(xù)訓練技術,支持代碼生成、注釋生成、單元測試生成、代碼智能問答等多種任務,支持Python、Java、JS、TS、Go、C++等10+種主流編程語言。
性能方面,在LivecodeBenchv5、BFCLV3等代碼生成榜單成績超越Qwen3及DeepSeekV3。
九天代碼大模型可快速實現HTML頁面設計:
九天數學大模型,在短思考、長思考模式均達到業(yè)界SOTA水平,在MATH500及AIME2024測評任務中指標超越Qwen3。
九天大模型數學推理方面表現出色,能夠準確理解數學問題的核心邏輯,并運用多種方法進行推理和驗證,精準地給出答案。
本題推導了Shor算法進行質因數分解時,量子傅里葉變換后的量子態(tài)坍縮概率分布公式,模型基于周期性態(tài)和量子傅里葉變換的數學性質計算測量結果的概率
高可控視覺生成,九天善智多模態(tài)能力煥新
九天善智多模態(tài)大模型全面提升生成可控性,基于復雜時空建模、流匹配圖片視頻漸進式聯(lián)合訓練、端到端局部可控注意力機制等創(chuàng)新,同時引入多模態(tài)理解信息提升對文本指令和輸入條件圖像視頻的感知能力,聯(lián)合圖文交織數據訓練,實現既能生成高質量的圖像視頻,又能進行多輪對話式高可控精確編輯操作,顯著提升了視覺生成的靈活便利性。
在圖片生成功能方面,可支持多輪精準局部修改,如修改文字、修改背景、增加元素等。如「生成一張公交站牌,站牌上寫著『5G』的圖片」。
將5G替換為6G
站牌旁邊停著一輛公交車
旁邊還有一輛摩托車
改成涂鴉風格
圖片動起來
在視頻生成功能方面,構建統(tǒng)一可控生成體系,視頻生成可控性進一步增強,支持基于個體軌跡控制的視頻生成,視頻續(xù)寫,基于運鏡控制的視頻生成以及視頻編輯能力。
針對基于個體軌跡控制的視頻生成,提出層次化運動建模與動態(tài)特征對齊技術,突破長程依賴建模難題。
創(chuàng)新性地利用運動向量解耦與三模態(tài)協(xié)同控制技術,實現支持亞像素級路徑和適配多曲率運動軌跡的視頻軌跡控制能力。
基于運鏡控制的視頻生成技術,利用語義信息解耦和時序條件注入,并通過引入相機姿態(tài)信息,模擬真實物理世界成像規(guī)律,實現對生成視頻運鏡的精準控制。
視頻編輯能力創(chuàng)新性引入自適應編輯模塊和結構化噪聲設計,有效提升用戶指令跟隨能力,保證編輯前后運動以及非編輯區(qū)域的視覺一致性。
視頻編輯-刪除操作
視頻編輯-替換操作
多模態(tài)大模型在圖理解和視頻理解方面的性能表現也全面提升。圖理解方面,采用了token-mixing策略與視覺重采樣方案,巧妙地平衡了全局感知和細粒度感知能力,使得模型在處理更高分辨率的輸入圖像時,依然能保持出色的性能表現,進而實現了綜合能力的顯著提升。
在MMStar、HallusionBench和OCRBench等圖理解任務中,九天模型分別獲得了82.2、64.3和94.9的高分,OpenCompass綜合評分79.5分,領先其他大部分模型。
視頻理解方面,九天模型設計金字塔型記憶庫結構和多層漸進式的視覺token融合方案,兼顧視頻流中的時間和空間信息,提升模型對于長時視覺信號的理解能力。
在Videomme任務中表現優(yōu)秀,超越Qwen2-VL和GPT-4o,在MVbench任務領先其余模型。
8月6日開始,九天將開展一系列技術直播,重點解析九天基礎大模型、開源模型及數據集,鎖定「九天人工智能」視頻號,獲取最新技術干貨。
附錄
九天開源模型和評測體系下載鏈接
1.數學大模型:JT-Math-8B系列模型
煥新社區(qū)地址(下載方式見文末):
JT-Math-8B-Instruct:
https://aihuanxin.cn/#/model?path=/model/detail/1463
JT-Math-8B-Thinking:
https://aihuanxin.cn/#/model?path=/model/detail/1464
JT-Math-8B-Base:
https://aihuanxin.cn/#/model?path=/model/detail/1459
Huggingface地址:
https://huggingface.co/JT-LM/JT-Math-8B-Base
https://huggingface.co/JT-LM/JT-Math-8B-Instruct
https://huggingface.co/JT-LM/JT-Math-8B-Thinking
ModelScope地址:
https://www.modelscope.cn/models/JiuTian-AI/JT-Math-8B-Instruct
https://www.modelscope.cn/models/JiuTian-AI/JT-Math-8B-Base
https://www.modelscope.cn/models/JiuTian-AI/JT-Math-8B-Thinking
github地址:
https://github.com/JT-LM/JT-Math-8B
gitee地址:
https://gitee.com/CMCC-jiutian/jt-math-8b.git
2.代碼大模型:JT-Coder-8B系列模型
煥新社區(qū)地址(下載方式見文末):
JT-Coder-8B-Instruct:
https://aihuanxin.cn/#/model?path=/model/detail/1458
JT-Coder-8B-Base:
https://aihuanxin.cn/#/model?path=/model/detail/1466
Huggingface地址:
https://huggingface.co/JT-LM/JT-Coder-8B-Base
https://huggingface.co/JT-LM/JT-Coder-8B-Instruct
ModelScope地址:
https://www.modelscope.cn/models/JiuTian-AI/JT-Coder-8B-Base
https://www.modelscope.cn/models/JiuTian-AI/JT-Coder-8B-Instruct
煥新社區(qū)開源獲取方式:
進入煥新社區(qū)(aihuanxin.cn),進入模型庫/數據集,選擇組織【九天人工智能】,快速獲取九天最新開源內容。
十大非常好看的驚悚無限流小說,恐怖燒腦,絕境求生
無限流文推薦:二十六本無限流言情文推薦
無限類小說20本,量大,滿足閱讀
免責聲明:本文內容由開放的智能模型自動生成,僅供參考。