允中發(fā)自凹非寺量子位|公眾號QbitAI
7月26日,在世界人工智能大會(WAIC)上,中國移動正式發(fā)布了MoMA多模型與智能體聚合及服務(wù)引擎。
MoMA引擎通過匯聚業(yè)界多種優(yōu)質(zhì)模型與智能體,能夠根據(jù)應(yīng)用場景,自動匹配及調(diào)用最優(yōu)專家模型和專用智能體,形成超級大模型能力服務(wù)基座,為解決復(fù)雜任務(wù)提供更為強(qiáng)大的解決方案。
01.當(dāng)前主要的問題與挑戰(zhàn)
目前,國內(nèi)外已發(fā)布多款模型,每個模型在不同時間段內(nèi)在某些應(yīng)用場景表現(xiàn)出卓越的能力,例如代碼編寫、寫作、數(shù)學(xué)、翻譯等。
未來將是多種模型共存的局面,HuggingFace已有數(shù)百萬個這些模型的微調(diào)變體。因此,企業(yè)在應(yīng)用這些模型時面臨如下挑戰(zhàn):
一是調(diào)度與組合難題:如何選擇不同能力和接口各異智能體、模型進(jìn)行有效的組合解決具體問題;二是意圖理解與規(guī)劃挑戰(zhàn):用戶指令語義豐富且目標(biāo)模糊,要求智能體具備更強(qiáng)的意圖探測能力,以規(guī)劃更優(yōu)執(zhí)行路徑。三是成本收益平衡:如何平衡效率、效果和成本三者關(guān)系,達(dá)到提速降本的目標(biāo)。
MoMA通過多級路由技術(shù),主要解決了模型的路由選擇和能力規(guī)劃調(diào)度的基礎(chǔ)問題,為企業(yè)及個人用戶解決上述痛點與挑戰(zhàn)提供了具體方案。
02.MoMA是什么?
九天MoMA(MixtureofModelsandAgents)即多模型與智能體聚合及服務(wù)引擎,通過標(biāo)準(zhǔn)化接口廣泛匯聚業(yè)界優(yōu)質(zhì)大模型與專用智能體,面向復(fù)雜行業(yè)場景提供“場景-模型-智能體”的自動感知、動態(tài)編排與最優(yōu)調(diào)用能力,形成具備持續(xù)進(jìn)化特性的超級大模型服務(wù)基座,提供高準(zhǔn)確率、高安全、高可靠、高效能的大模型推理服務(wù)。
MoMA核心主要包括三部分:
MoMA模型
MoMA根據(jù)對模型能力的探測和智能體能力的評估,以及對用戶意圖的理解和識別,明確不同組合下的協(xié)同優(yōu)勢與潛在沖突;根據(jù)對用戶輸入的分析,判斷模型和智能體的依賴關(guān)系及其能力范圍,自動選擇最佳方案。
同時,通過閉環(huán)監(jiān)控反饋機(jī)制,構(gòu)建“實時感知-動態(tài)調(diào)整-持續(xù)驗證”的循環(huán)鏈路,以更好地適應(yīng)數(shù)據(jù)變化、業(yè)務(wù)需求和環(huán)境波動。
模型能力洞察及構(gòu)建主要通過對模型和智能體能力的深入探測,從成本、效果和難易程度等方面構(gòu)建其能力高維表征,實現(xiàn)用戶需求與智能體路由的快速匹配;通過評分機(jī)制,評估不同模型和智能體的效果,便于分層路由模型進(jìn)行快速任務(wù)分發(fā)。
通過原創(chuàng)性地提出“問題難度-領(lǐng)域矩陣”(Problem-difficultyvs.DomainMatrix,PD2-Matrix)的大語言模型(LLM)系統(tǒng)性框架,核心目標(biāo)是通過標(biāo)準(zhǔn)化分類與評估,全面揭示模型在不同任務(wù)場景下的表現(xiàn)邊界,以及不同模型在相同領(lǐng)域問題上的排名情況。
該框架將任務(wù)按照問題復(fù)雜度與知識領(lǐng)域兩個正交維度進(jìn)行系統(tǒng)化分類,并在每個矩陣單元設(shè)計差異化的評估指標(biāo)。其核心創(chuàng)新在于將大語言模型的“黑箱”能力轉(zhuǎn)化為結(jié)構(gòu)化的“能力矩陣”,通過正交維度分類、探測工具和可視化分析,實現(xiàn)了從“籠統(tǒng)評估”到“精準(zhǔn)診斷”的跨越。
在PD2-Matrix框架下,采用Pareto優(yōu)化擬合給定任務(wù)分布上T的模型得分(效果)S(T)與成本C的得分–成本(S-C)曲線,實現(xiàn)了效果和成本之間的動態(tài)權(quán)衡和調(diào)整。
通過上述流程,不僅在PD2-Matrix框架下實現(xiàn)了對性能-成本關(guān)系的可解釋建模,還能以任務(wù)分布T為條件,為不同下游應(yīng)用提供個性化的資源-性能權(quán)衡策略,最終達(dá)到“用最小的成本獲得所需的性能”這一核心目標(biāo)。
MoMA工程引擎
以分層路由與動態(tài)編排為核心,通過標(biāo)準(zhǔn)的協(xié)議連接模型、智能體、工具,形成超級大模型能力基座,實現(xiàn)對任務(wù)類型、資源分配、執(zhí)行流程的動態(tài)管理,在效果、成本、效率三重約束下完成最優(yōu)決策,提速降本。
多級路由機(jī)制及動態(tài)洞察
在分層路由模型機(jī)制中,多級路由各司其職,分層次完成復(fù)雜任務(wù)的拆解與實現(xiàn)。其中一級路由完成專家模型、簡單任務(wù)、復(fù)雜任務(wù)的分發(fā);二級路由在綜合準(zhǔn)確度和成本的條件下,根據(jù)復(fù)雜度把問題分發(fā)到具備不同參數(shù)規(guī)模或者是專長的專家模型予以響應(yīng);采用MonitorModel對推理內(nèi)容進(jìn)行實時監(jiān)控、復(fù)盤兩級路由模型的分發(fā)質(zhì)量,同時豐富標(biāo)注數(shù)據(jù)集動態(tài)優(yōu)化路由模型。
復(fù)雜任務(wù)去中心化
對于用戶多意圖及復(fù)雜任務(wù),MoMA工程引擎采用了Planner-Executor-Summarizer架構(gòu),能夠根據(jù)具體任務(wù)動態(tài)地采用ReAct、Route、Parallelize、Swarm等混合模式,實現(xiàn)任務(wù)的自動拆解、編排與并行調(diào)用。
傳統(tǒng)AI系統(tǒng)通常采用固定模式回答問題,規(guī)劃執(zhí)行的步驟越多,所需的計算資源也越多,在某些任務(wù)中,AI可能在無需人工干預(yù)的情況下執(zhí)行數(shù)十個步驟。通過采用復(fù)雜任務(wù)路由技術(shù),將請求發(fā)送給專門的規(guī)劃模型,選擇不同的執(zhí)行模式或混合模式,將用戶的意圖分配至合適的智能體或大模型,并通過監(jiān)控推理輸出內(nèi)容,進(jìn)行動態(tài)接管與調(diào)整,從而保證回答的效果和效率。
此外,這種方式還避免了或減少了依賴中心規(guī)劃模型對智能體或工具輸出內(nèi)容的重復(fù)推理評估,降低了輸出幻覺,提升了整體響應(yīng)時間,全面優(yōu)化了用戶體驗。
MoMA協(xié)議體系
目前針對模型與外部工具、數(shù)據(jù)源之間,智能體與智能體之間的協(xié)同問題,業(yè)界已有部分協(xié)議嘗試對其進(jìn)行規(guī)范化。主流協(xié)議包括Anthropic公司提出的MCP(ModelContextProtocol,模型上下文協(xié)議)和Google提出的A2A(Agent2Agent)。
其中MCP是一種用于規(guī)范模型或智能體與外部數(shù)據(jù)源、工具和服務(wù)之間的交互的開放協(xié)議,其通過結(jié)構(gòu)化的輸入/輸出將模型或智能體與工具、API和資源連接起來,可以將其視為模型或智能體擴(kuò)展自身能力的標(biāo)準(zhǔn)方式。
A2A協(xié)議則是一種用于智能體之間通信與互操作性的開放標(biāo)準(zhǔn),其為由不同框架、不同語言或不同廠商構(gòu)建的智能體提供了一套通用的語言與交互接口。原生的MCP協(xié)議沒有對模型和工具之間交互的安全性進(jìn)行限制,同時工具對模型的可調(diào)度性也缺少規(guī)約。
MoMA在兼容業(yè)界規(guī)范的基礎(chǔ)上拓展統(tǒng)一認(rèn)證、安全通信等能力,對工具的可調(diào)度性進(jìn)行了增強(qiáng),在此基礎(chǔ)上構(gòu)建了中國移動特色的A2A,MCP協(xié)議,實現(xiàn)對業(yè)界智能體生態(tài)的兼容,形成開放、安全、可信、高效的中國移動智能體技術(shù)體系的服務(wù)底座。
03.MoMA應(yīng)用
MoMA聚合包括九天大模型、Qwen和DeepSeek等15+個高質(zhì)量內(nèi)外部模型,涵蓋通用模型和專業(yè)模型,涉及編程、數(shù)學(xué)、翻譯、醫(yī)療等多個領(lǐng)域,并接入了20多個專家智能體,例如日常管理、會議助手、咪咕音樂和深度報告等,幫助用戶迅速解決專業(yè)領(lǐng)域的問題,精準(zhǔn)匹配用戶需求。
在覆蓋百萬級用戶的情況下,MoMA的動態(tài)路由機(jī)制在不同參數(shù)模型(1B、3B、8B、75B、200B)之間靈活切換,整體速度相比固定的75B參數(shù)模型提升了42%。
目前,MoMA已應(yīng)用于中國移動的靈犀智能體2.0,助力靈犀智能體全面升級為跨領(lǐng)域、多任務(wù)、自規(guī)劃的通用型智能體,為用戶在“通信、生活、出行、辦公、家庭”等多元化場景中提供特色服務(wù)。
04.商業(yè)化落地愿景
中國移動在新技術(shù)研發(fā)的道路上一直持續(xù)深耕并獲得廣泛認(rèn)可,MoMA聚合引擎的發(fā)布提供了中國移動與各產(chǎn)業(yè)合作的新范式。
隨著更多行業(yè)實踐的深入,中國移動將持續(xù)釋放生產(chǎn)力價值,致力于為開發(fā)者及大模型企業(yè)提供人工智能快速解決方案,在技術(shù)創(chuàng)新、產(chǎn)品迭代與生態(tài)建設(shè)方面,持續(xù)前進(jìn),為廣大用戶提供更好的產(chǎn)品與服務(wù),帶動產(chǎn)業(yè)與技術(shù)的創(chuàng)新與規(guī)?;l(fā)展。
通過MoMA多模型與智能體聚合及服務(wù)引擎,中國移動將依托充沛的算力資源,實現(xiàn)業(yè)界優(yōu)質(zhì)大模型及智能體的匯聚及靈活調(diào)度,構(gòu)建起百?;ヂ?lián)、千智協(xié)同的全新產(chǎn)業(yè)協(xié)同生態(tài),打造AI能力聚合和普惠服務(wù)的全新智能服務(wù)范式,將驅(qū)動中國人工智能產(chǎn)業(yè)邁入發(fā)展新階段。
為方便產(chǎn)業(yè)合作伙伴了解MoMA并參與其生態(tài)共建,九天人工智能研究院發(fā)布了《多模型與智能體聚合及服務(wù)引擎(MoMA)白皮書(2025)》。白皮書介紹了MoMA的目標(biāo)愿景和總體框架、關(guān)鍵技術(shù)特征、典型應(yīng)用場景和未來展望與倡議,可掃碼獲取白皮書原文。
8月6日開始,九天將開展一系列技術(shù)直播,重點解析九天基礎(chǔ)大模型、開源模型及數(shù)據(jù)集,鎖定“九天人工智能”視頻號,獲取最新技術(shù)干貨。
*本文系量子位獲授權(quán)刊載,觀點僅為原作者所有。
我變成了一只吸血鬼,本打算安安穩(wěn)穩(wěn)度過鬼生,沒想到遇上了男神
10部奇幻浪漫愛情劇,每一部都超甜哦
吸血鬼系甜文:《晚安吸血鬼大人》他霸道又溫柔,小東西,別想逃