允中發(fā)自凹非寺量子位|公眾號QbitAI
7月26日,在世界人工智能大會(WAIC)上,中國移動正式發(fā)布了MoMA多模型與智能體聚合及服務引擎。
MoMA引擎通過匯聚業(yè)界多種優(yōu)質模型與智能體,能夠根據(jù)應用場景,自動匹配及調用最優(yōu)專家模型和專用智能體,形成超級大模型能力服務基座,為解決復雜任務提供更為強大的解決方案。
01.當前主要的問題與挑戰(zhàn)
目前,國內外已發(fā)布多款模型,每個模型在不同時間段內在某些應用場景表現(xiàn)出卓越的能力,例如代碼編寫、寫作、數(shù)學、翻譯等。
未來將是多種模型共存的局面,HuggingFace已有數(shù)百萬個這些模型的微調變體。因此,企業(yè)在應用這些模型時面臨如下挑戰(zhàn):
一是調度與組合難題:如何選擇不同能力和接口各異智能體、模型進行有效的組合解決具體問題;二是意圖理解與規(guī)劃挑戰(zhàn):用戶指令語義豐富且目標模糊,要求智能體具備更強的意圖探測能力,以規(guī)劃更優(yōu)執(zhí)行路徑。三是成本收益平衡:如何平衡效率、效果和成本三者關系,達到提速降本的目標。
MoMA通過多級路由技術,主要解決了模型的路由選擇和能力規(guī)劃調度的基礎問題,為企業(yè)及個人用戶解決上述痛點與挑戰(zhàn)提供了具體方案。
02.MoMA是什么?
九天MoMA(MixtureofModelsandAgents)即多模型與智能體聚合及服務引擎,通過標準化接口廣泛匯聚業(yè)界優(yōu)質大模型與專用智能體,面向復雜行業(yè)場景提供“場景-模型-智能體”的自動感知、動態(tài)編排與最優(yōu)調用能力,形成具備持續(xù)進化特性的超級大模型服務基座,提供高準確率、高安全、高可靠、高效能的大模型推理服務。
MoMA核心主要包括三部分:
MoMA模型
MoMA根據(jù)對模型能力的探測和智能體能力的評估,以及對用戶意圖的理解和識別,明確不同組合下的協(xié)同優(yōu)勢與潛在沖突;根據(jù)對用戶輸入的分析,判斷模型和智能體的依賴關系及其能力范圍,自動選擇最佳方案。
同時,通過閉環(huán)監(jiān)控反饋機制,構建“實時感知-動態(tài)調整-持續(xù)驗證”的循環(huán)鏈路,以更好地適應數(shù)據(jù)變化、業(yè)務需求和環(huán)境波動。
模型能力洞察及構建主要通過對模型和智能體能力的深入探測,從成本、效果和難易程度等方面構建其能力高維表征,實現(xiàn)用戶需求與智能體路由的快速匹配;通過評分機制,評估不同模型和智能體的效果,便于分層路由模型進行快速任務分發(fā)。
通過原創(chuàng)性地提出“問題難度-領域矩陣”(Problem-difficultyvs.DomainMatrix,PD2-Matrix)的大語言模型(LLM)系統(tǒng)性框架,核心目標是通過標準化分類與評估,全面揭示模型在不同任務場景下的表現(xiàn)邊界,以及不同模型在相同領域問題上的排名情況。
該框架將任務按照問題復雜度與知識領域兩個正交維度進行系統(tǒng)化分類,并在每個矩陣單元設計差異化的評估指標。其核心創(chuàng)新在于將大語言模型的“黑箱”能力轉化為結構化的“能力矩陣”,通過正交維度分類、探測工具和可視化分析,實現(xiàn)了從“籠統(tǒng)評估”到“精準診斷”的跨越。
在PD2-Matrix框架下,采用Pareto優(yōu)化擬合給定任務分布上T的模型得分(效果)S(T)與成本C的得分–成本(S-C)曲線,實現(xiàn)了效果和成本之間的動態(tài)權衡和調整。
通過上述流程,不僅在PD2-Matrix框架下實現(xiàn)了對性能-成本關系的可解釋建模,還能以任務分布T為條件,為不同下游應用提供個性化的資源-性能權衡策略,最終達到“用最小的成本獲得所需的性能”這一核心目標。
MoMA工程引擎
以分層路由與動態(tài)編排為核心,通過標準的協(xié)議連接模型、智能體、工具,形成超級大模型能力基座,實現(xiàn)對任務類型、資源分配、執(zhí)行流程的動態(tài)管理,在效果、成本、效率三重約束下完成最優(yōu)決策,提速降本。
多級路由機制及動態(tài)洞察
在分層路由模型機制中,多級路由各司其職,分層次完成復雜任務的拆解與實現(xiàn)。其中一級路由完成專家模型、簡單任務、復雜任務的分發(fā);二級路由在綜合準確度和成本的條件下,根據(jù)復雜度把問題分發(fā)到具備不同參數(shù)規(guī)?;蛘呤菍iL的專家模型予以響應;采用MonitorModel對推理內容進行實時監(jiān)控、復盤兩級路由模型的分發(fā)質量,同時豐富標注數(shù)據(jù)集動態(tài)優(yōu)化路由模型。
復雜任務去中心化
對于用戶多意圖及復雜任務,MoMA工程引擎采用了Planner-Executor-Summarizer架構,能夠根據(jù)具體任務動態(tài)地采用ReAct、Route、Parallelize、Swarm等混合模式,實現(xiàn)任務的自動拆解、編排與并行調用。
傳統(tǒng)AI系統(tǒng)通常采用固定模式回答問題,規(guī)劃執(zhí)行的步驟越多,所需的計算資源也越多,在某些任務中,AI可能在無需人工干預的情況下執(zhí)行數(shù)十個步驟。通過采用復雜任務路由技術,將請求發(fā)送給專門的規(guī)劃模型,選擇不同的執(zhí)行模式或混合模式,將用戶的意圖分配至合適的智能體或大模型,并通過監(jiān)控推理輸出內容,進行動態(tài)接管與調整,從而保證回答的效果和效率。
此外,這種方式還避免了或減少了依賴中心規(guī)劃模型對智能體或工具輸出內容的重復推理評估,降低了輸出幻覺,提升了整體響應時間,全面優(yōu)化了用戶體驗。
MoMA協(xié)議體系
目前針對模型與外部工具、數(shù)據(jù)源之間,智能體與智能體之間的協(xié)同問題,業(yè)界已有部分協(xié)議嘗試對其進行規(guī)范化。主流協(xié)議包括Anthropic公司提出的MCP(ModelContextProtocol,模型上下文協(xié)議)和Google提出的A2A(Agent2Agent)。
其中MCP是一種用于規(guī)范模型或智能體與外部數(shù)據(jù)源、工具和服務之間的交互的開放協(xié)議,其通過結構化的輸入/輸出將模型或智能體與工具、API和資源連接起來,可以將其視為模型或智能體擴展自身能力的標準方式。
A2A協(xié)議則是一種用于智能體之間通信與互操作性的開放標準,其為由不同框架、不同語言或不同廠商構建的智能體提供了一套通用的語言與交互接口。原生的MCP協(xié)議沒有對模型和工具之間交互的安全性進行限制,同時工具對模型的可調度性也缺少規(guī)約。
MoMA在兼容業(yè)界規(guī)范的基礎上拓展統(tǒng)一認證、安全通信等能力,對工具的可調度性進行了增強,在此基礎上構建了中國移動特色的A2A,MCP協(xié)議,實現(xiàn)對業(yè)界智能體生態(tài)的兼容,形成開放、安全、可信、高效的中國移動智能體技術體系的服務底座。
03.MoMA應用
MoMA聚合包括九天大模型、Qwen和DeepSeek等15+個高質量內外部模型,涵蓋通用模型和專業(yè)模型,涉及編程、數(shù)學、翻譯、醫(yī)療等多個領域,并接入了20多個專家智能體,例如日常管理、會議助手、咪咕音樂和深度報告等,幫助用戶迅速解決專業(yè)領域的問題,精準匹配用戶需求。
在覆蓋百萬級用戶的情況下,MoMA的動態(tài)路由機制在不同參數(shù)模型(1B、3B、8B、75B、200B)之間靈活切換,整體速度相比固定的75B參數(shù)模型提升了42%。
目前,MoMA已應用于中國移動的靈犀智能體2.0,助力靈犀智能體全面升級為跨領域、多任務、自規(guī)劃的通用型智能體,為用戶在“通信、生活、出行、辦公、家庭”等多元化場景中提供特色服務。
04.商業(yè)化落地愿景
中國移動在新技術研發(fā)的道路上一直持續(xù)深耕并獲得廣泛認可,MoMA聚合引擎的發(fā)布提供了中國移動與各產業(yè)合作的新范式。
隨著更多行業(yè)實踐的深入,中國移動將持續(xù)釋放生產力價值,致力于為開發(fā)者及大模型企業(yè)提供人工智能快速解決方案,在技術創(chuàng)新、產品迭代與生態(tài)建設方面,持續(xù)前進,為廣大用戶提供更好的產品與服務,帶動產業(yè)與技術的創(chuàng)新與規(guī)?;l(fā)展。
通過MoMA多模型與智能體聚合及服務引擎,中國移動將依托充沛的算力資源,實現(xiàn)業(yè)界優(yōu)質大模型及智能體的匯聚及靈活調度,構建起百模互聯(lián)、千智協(xié)同的全新產業(yè)協(xié)同生態(tài),打造AI能力聚合和普惠服務的全新智能服務范式,將驅動中國人工智能產業(yè)邁入發(fā)展新階段。
為方便產業(yè)合作伙伴了解MoMA并參與其生態(tài)共建,九天人工智能研究院發(fā)布了《多模型與智能體聚合及服務引擎(MoMA)白皮書(2025)》。白皮書介紹了MoMA的目標愿景和總體框架、關鍵技術特征、典型應用場景和未來展望與倡議,可掃碼獲取白皮書原文。
8月6日開始,九天將開展一系列技術直播,重點解析九天基礎大模型、開源模型及數(shù)據(jù)集,鎖定“九天人工智能”視頻號,獲取最新技術干貨。
*本文系量子位獲授權刊載,觀點僅為原作者所有。
免責聲明:本文內容由開放的智能模型自動生成,僅供參考。