楊志宏
新智元報(bào)道
KingHZ桃子
【新智元導(dǎo)讀】九天基礎(chǔ)大模型3.0震撼發(fā)布!在2025世界人工智能大會(huì)上,九天基礎(chǔ)大模型端到端技術(shù)全面升級(jí),性能飆升35%,智能體調(diào)用效率提升21%,15Ttoken預(yù)訓(xùn)練,還是全國(guó)產(chǎn)!
7月26日,在2025世界人工智能大會(huì)期間,中國(guó)移動(dòng)煥新發(fā)布「九天」基礎(chǔ)大模型3.0。
本次發(fā)布的「九天」基礎(chǔ)大模型3.0,重點(diǎn)聚焦模型的端到端技術(shù)升級(jí)以及生成可控性能力的增強(qiáng),進(jìn)一步強(qiáng)化九天大模型「高安全、高可控、全國(guó)產(chǎn)、全行業(yè)」的獨(dú)特優(yōu)勢(shì)。
端到端升級(jí),九天眾擎性能大躍升
九天眾擎語言大模型1.0于2023年10月發(fā)布,實(shí)現(xiàn)了大模型數(shù)據(jù)構(gòu)建、預(yù)訓(xùn)練、微調(diào)、推理等全鏈路核心技術(shù)自主研發(fā),是首個(gè)通過國(guó)家網(wǎng)信辦雙備案的央企大模型。
九天眾擎語言大模型2.0于2024年7月發(fā)布,創(chuàng)新提出基于稀疏專家混合語言架構(gòu),模型參數(shù)及訓(xùn)練數(shù)據(jù)均有飛躍性提升,預(yù)訓(xùn)練階段采用了5萬億Token數(shù)據(jù),此外,還引入了10%的行業(yè)知識(shí)數(shù)據(jù)。
本次發(fā)布的語言大模型3.0在架構(gòu)、數(shù)據(jù)、后訓(xùn)練、算力適配等方面實(shí)現(xiàn)了升級(jí)和技術(shù)創(chuàng)新。
架構(gòu)方面,突破性采用業(yè)界領(lǐng)先的MoE(MixtureofExperts)架構(gòu),通過并行優(yōu)化、混精計(jì)算優(yōu)化、權(quán)重去冗余優(yōu)化、構(gòu)建自動(dòng)故障恢復(fù)程序、框架快速編譯與編譯緩存、全局集合通信域異步創(chuàng)建及算子通信預(yù)建鏈等技術(shù)創(chuàng)新,解決了大模型解決算法精度溢出、非確定性計(jì)算誤差、檢查點(diǎn)存儲(chǔ)慢、稀疏模型訓(xùn)練效率低下等問題。
數(shù)據(jù)方面,預(yù)訓(xùn)練數(shù)據(jù)總規(guī)模擴(kuò)增到15Ttoken,采用了多階段配比方式:在第一階段學(xué)習(xí)海量知識(shí),第二階段用高質(zhì)量數(shù)據(jù)重點(diǎn)提升數(shù)學(xué)推理等各種專項(xiàng)能力,第三階段(退火階段)用長(zhǎng)文數(shù)據(jù)和更高質(zhì)量數(shù)據(jù)進(jìn)行能力上的進(jìn)一步爬坡。
在高質(zhì)量數(shù)據(jù)方面,對(duì)數(shù)學(xué)、邏輯推理、代碼、專業(yè)知識(shí)等重點(diǎn)領(lǐng)域進(jìn)行了大幅增強(qiáng),在數(shù)據(jù)上實(shí)現(xiàn)了簡(jiǎn)潔回答與長(zhǎng)思維鏈深度思考的有機(jī)結(jié)合。
此外,還構(gòu)建了覆蓋全流程的數(shù)據(jù)治理體系技術(shù)架構(gòu),涵蓋多源異構(gòu)語料采集、深度清洗與標(biāo)注等關(guān)鍵環(huán)節(jié),還集成了敏感度檢測(cè)、動(dòng)態(tài)資源調(diào)度等核心能力,能夠?qū)崿F(xiàn)多語言、多文化、多地域表達(dá)的高質(zhì)量覆蓋,特別是在復(fù)雜語境與稀缺資源條件下具備顯著優(yōu)勢(shì)。
后訓(xùn)練方面,在數(shù)據(jù)篩選階段,核心創(chuàng)新在于構(gòu)建了包含113域×53能力的「二維分級(jí)」數(shù)據(jù)體系,并系統(tǒng)性應(yīng)用了基于「質(zhì)量/難度/多樣性/必要性」的四維篩選準(zhǔn)則;
在數(shù)據(jù)合成階段,創(chuàng)新性地提出層級(jí)原則體系,實(shí)現(xiàn)從安全到高級(jí)文風(fēng)再到模型個(gè)性的多維度精準(zhǔn)指導(dǎo),同時(shí)設(shè)計(jì)了數(shù)據(jù)驅(qū)動(dòng)原則歸納方法及動(dòng)態(tài)應(yīng)用機(jī)制,從高質(zhì)量數(shù)據(jù)中自動(dòng)提煉隱形規(guī)則,助力九天模型從機(jī)械式檢索進(jìn)化為能輸出商業(yè)洞察與情感共鳴的智能助手;
在強(qiáng)化學(xué)習(xí)階段,設(shè)計(jì)了一種多階段的強(qiáng)化學(xué)習(xí)訓(xùn)練方法,創(chuàng)新性地結(jié)合了動(dòng)態(tài)溫度調(diào)節(jié)、難度自適應(yīng)的數(shù)據(jù)更新機(jī)制以及上下文窗口逐步擴(kuò)展策略,實(shí)現(xiàn)了在長(zhǎng)期訓(xùn)練過程中的穩(wěn)定性保障與模型能力的持續(xù)提升。
算力適配方面,九天眾擎語言大模型3.0實(shí)現(xiàn)了在算子、框架、模型三個(gè)層面的全棧國(guó)產(chǎn)適配,實(shí)現(xiàn)了與11家芯片廠商17款國(guó)產(chǎn)AI芯片的適配,在研發(fā)期間共解決了200+個(gè)芯片硬件、集群、算子、算法框架中的缺陷,完成60項(xiàng)算子和訓(xùn)練算法方面的優(yōu)化。
通過多維度的端到端技術(shù)升級(jí),模型的復(fù)雜推理能力較上一代提升35%,智能體調(diào)用效率提升21%,實(shí)現(xiàn)了性能的跨越式進(jìn)步。
在IFEval評(píng)測(cè)中,「九天」以88.61分超越其他模型,在MMLU-Pro測(cè)評(píng)中,以71.41分超越Qwen3,在ArenaHardV0.1測(cè)評(píng)中,以91.4分超越DeepSeekV3。
性能躍升的同時(shí),九天眾擎語言大模型以「高可控智能體」為核心,構(gòu)建了覆蓋知識(shí)問答、角色服務(wù)、流程控制的全鏈路解決方案。在知識(shí)問答層面,具有低幻覺文檔問答能力,通過深度語義解析精準(zhǔn)捕捉用戶意圖,依托真實(shí)文檔實(shí)現(xiàn)有據(jù)回復(fù),確保信息生成的真實(shí)性與可靠性。
角色扮演服務(wù)場(chǎng)景中,模型聚焦沉浸式角色演繹,深度解析角色背景信息與SOP服務(wù)流程,基于深度推理能力模擬角色思考邏輯,顯著提升客戶交互的真實(shí)感與專業(yè)度。
在業(yè)務(wù)流程控制環(huán)節(jié),九天眾擎語言大模型支持自然語言、偽代碼、Mermaid等多種方式描述業(yè)務(wù)規(guī)范流程,嚴(yán)格遵守既定工作流程與API接口協(xié)作規(guī)則,靈活應(yīng)對(duì)多嵌套、多分支的復(fù)雜任務(wù),有效規(guī)避「規(guī)劃幻覺」風(fēng)險(xiǎn),保障業(yè)務(wù)流程執(zhí)行的確定性與可控性。
基于最新的語言大模型,中國(guó)移動(dòng)此次也推出多個(gè)專項(xiàng)大模型。九天代碼大模型使用兩階段的持續(xù)訓(xùn)練技術(shù),支持代碼生成、注釋生成、單元測(cè)試生成、代碼智能問答等多種任務(wù),支持Python、Java、JS、TS、Go、C++等10+種主流編程語言。
性能方面,在LivecodeBenchv5、BFCLV3等代碼生成榜單成績(jī)超越Qwen3及DeepSeekV3。
九天代碼大模型可快速實(shí)現(xiàn)HTML頁面設(shè)計(jì):
九天數(shù)學(xué)大模型,在短思考、長(zhǎng)思考模式均達(dá)到業(yè)界SOTA水平,在MATH500及AIME2024測(cè)評(píng)任務(wù)中指標(biāo)超越Qwen3。
九天大模型數(shù)學(xué)推理方面表現(xiàn)出色,能夠準(zhǔn)確理解數(shù)學(xué)問題的核心邏輯,并運(yùn)用多種方法進(jìn)行推理和驗(yàn)證,精準(zhǔn)地給出答案。
本題推導(dǎo)了Shor算法進(jìn)行質(zhì)因數(shù)分解時(shí),量子傅里葉變換后的量子態(tài)坍縮概率分布公式,模型基于周期性態(tài)和量子傅里葉變換的數(shù)學(xué)性質(zhì)計(jì)算測(cè)量結(jié)果的概率
高可控視覺生成,九天善智多模態(tài)能力煥新
九天善智多模態(tài)大模型全面提升生成可控性,基于復(fù)雜時(shí)空建模、流匹配圖片視頻漸進(jìn)式聯(lián)合訓(xùn)練、端到端局部可控注意力機(jī)制等創(chuàng)新,同時(shí)引入多模態(tài)理解信息提升對(duì)文本指令和輸入條件圖像視頻的感知能力,聯(lián)合圖文交織數(shù)據(jù)訓(xùn)練,實(shí)現(xiàn)既能生成高質(zhì)量的圖像視頻,又能進(jìn)行多輪對(duì)話式高可控精確編輯操作,顯著提升了視覺生成的靈活便利性。
在圖片生成功能方面,可支持多輪精準(zhǔn)局部修改,如修改文字、修改背景、增加元素等。如「生成一張公交站牌,站牌上寫著『5G』的圖片」。
將5G替換為6G
站牌旁邊停著一輛公交車
旁邊還有一輛摩托車
改成涂鴉風(fēng)格
圖片動(dòng)起來
在視頻生成功能方面,構(gòu)建統(tǒng)一可控生成體系,視頻生成可控性進(jìn)一步增強(qiáng),支持基于個(gè)體軌跡控制的視頻生成,視頻續(xù)寫,基于運(yùn)鏡控制的視頻生成以及視頻編輯能力。
針對(duì)基于個(gè)體軌跡控制的視頻生成,提出層次化運(yùn)動(dòng)建模與動(dòng)態(tài)特征對(duì)齊技術(shù),突破長(zhǎng)程依賴建模難題。
創(chuàng)新性地利用運(yùn)動(dòng)向量解耦與三模態(tài)協(xié)同控制技術(shù),實(shí)現(xiàn)支持亞像素級(jí)路徑和適配多曲率運(yùn)動(dòng)軌跡的視頻軌跡控制能力。
基于運(yùn)鏡控制的視頻生成技術(shù),利用語義信息解耦和時(shí)序條件注入,并通過引入相機(jī)姿態(tài)信息,模擬真實(shí)物理世界成像規(guī)律,實(shí)現(xiàn)對(duì)生成視頻運(yùn)鏡的精準(zhǔn)控制。
視頻編輯能力創(chuàng)新性引入自適應(yīng)編輯模塊和結(jié)構(gòu)化噪聲設(shè)計(jì),有效提升用戶指令跟隨能力,保證編輯前后運(yùn)動(dòng)以及非編輯區(qū)域的視覺一致性。
視頻編輯-刪除操作
視頻編輯-替換操作
多模態(tài)大模型在圖理解和視頻理解方面的性能表現(xiàn)也全面提升。圖理解方面,采用了token-mixing策略與視覺重采樣方案,巧妙地平衡了全局感知和細(xì)粒度感知能力,使得模型在處理更高分辨率的輸入圖像時(shí),依然能保持出色的性能表現(xiàn),進(jìn)而實(shí)現(xiàn)了綜合能力的顯著提升。
在MMStar、HallusionBench和OCRBench等圖理解任務(wù)中,九天模型分別獲得了82.2、64.3和94.9的高分,OpenCompass綜合評(píng)分79.5分,領(lǐng)先其他大部分模型。
視頻理解方面,九天模型設(shè)計(jì)金字塔型記憶庫結(jié)構(gòu)和多層漸進(jìn)式的視覺token融合方案,兼顧視頻流中的時(shí)間和空間信息,提升模型對(duì)于長(zhǎng)時(shí)視覺信號(hào)的理解能力。
在Videomme任務(wù)中表現(xiàn)優(yōu)秀,超越Qwen2-VL和GPT-4o,在MVbench任務(wù)領(lǐng)先其余模型。
8月6日開始,九天將開展一系列技術(shù)直播,重點(diǎn)解析九天基礎(chǔ)大模型、開源模型及數(shù)據(jù)集,鎖定「九天人工智能」視頻號(hào),獲取最新技術(shù)干貨。
附錄
九天開源模型和評(píng)測(cè)體系下載鏈接
1.數(shù)學(xué)大模型:JT-Math-8B系列模型
煥新社區(qū)地址(下載方式見文末):
JT-Math-8B-Instruct:
https://aihuanxin.cn/#/model?path=/model/detail/1463
JT-Math-8B-Thinking:
https://aihuanxin.cn/#/model?path=/model/detail/1464
JT-Math-8B-Base:
https://aihuanxin.cn/#/model?path=/model/detail/1459
Huggingface地址:
https://huggingface.co/JT-LM/JT-Math-8B-Base
https://huggingface.co/JT-LM/JT-Math-8B-Instruct
https://huggingface.co/JT-LM/JT-Math-8B-Thinking
ModelScope地址:
https://www.modelscope.cn/models/JiuTian-AI/JT-Math-8B-Instruct
https://www.modelscope.cn/models/JiuTian-AI/JT-Math-8B-Base
https://www.modelscope.cn/models/JiuTian-AI/JT-Math-8B-Thinking
github地址:
https://github.com/JT-LM/JT-Math-8B
gitee地址:
https://gitee.com/CMCC-jiutian/jt-math-8b.git
2.代碼大模型:JT-Coder-8B系列模型
煥新社區(qū)地址(下載方式見文末):
JT-Coder-8B-Instruct:
https://aihuanxin.cn/#/model?path=/model/detail/1458
JT-Coder-8B-Base:
https://aihuanxin.cn/#/model?path=/model/detail/1466
Huggingface地址:
https://huggingface.co/JT-LM/JT-Coder-8B-Base
https://huggingface.co/JT-LM/JT-Coder-8B-Instruct
ModelScope地址:
https://www.modelscope.cn/models/JiuTian-AI/JT-Coder-8B-Base
https://www.modelscope.cn/models/JiuTian-AI/JT-Coder-8B-Instruct
煥新社區(qū)開源獲取方式:
進(jìn)入煥新社區(qū)(aihuanxin.cn),進(jìn)入模型庫/數(shù)據(jù)集,選擇組織【九天人工智能】,快速獲取九天最新開源內(nèi)容。
獨(dú)特生命與自然的深刻反思
一個(gè)獨(dú)立且自信的人,不會(huì)將生活的重心置于他人身上。若我們一味地活在別人的評(píng)價(jià)之中,便可能迷失自我——。有人曾言:“自幼時(shí)起,我便深知一個(gè)道理:在短暫的宇宙光陰里,我們僅擁有幾十年的生命__。我期望能過得快樂些,因此我始終向著快樂的方向努力前行?!痹诙虝憾鴮氋F的一生中,我們應(yīng)當(dāng)首先取悅自己-_。通過不斷說完了。
探索生命的奧秘與獨(dú)特身體特征
? 獨(dú)特存在的意義每個(gè)人都是獨(dú)一無二的風(fēng)景,你的存在也能為別人的世界增添色彩。因此,與其仰望他人的輝煌,糾結(jié)于自己的不足,不如放下雜念,盡情欣賞自己的美好。正如那句話所說,你無需成為玫瑰,你可以選擇做茉莉、淡菊,或是無名小花,無論如何,活出自己才是對(duì)生命最美的饋贈(zèng)。
李玫瑾:讓孩子認(rèn)識(shí)自身特長(zhǎng),以獨(dú)特性立于世,而不是使勁超過誰
來源:紅網(wǎng)
作者:賽子璇
編輯:齋浩初
本文為紅辣椒評(píng)論 原創(chuàng)文章,僅系作者個(gè)人觀點(diǎn),不代表紅網(wǎng)立場(chǎng)。轉(zhuǎn)載請(qǐng)附原文出處鏈接和本聲明。