黃雅如
作者:周源/華爾街見聞
7月27日,自動駕駛全棧技術與運營服務提供商蘑菇車聯(lián)(MOGOX),在2025WAIC發(fā)布首個物理世界認知大模型“MogoMind”。
通過全域覆蓋的通感算一體化設備,MogoMind能全天候、不間斷捕捉車輛行駛軌跡、速度變化、交通流量、行人動態(tài)等海量異構數(shù)據(jù)。
蘑菇車聯(lián)副總裁王凱表示,相比數(shù)字世界的大模型,MogoMind可視為物理世界的實時搜索引擎,是通往現(xiàn)實世界的超級入口。
王凱說,“通過接入物理世界實時動態(tài)數(shù)據(jù),MogoMind能實現(xiàn)全局感知、深度認知與實時推理決策,為AI網(wǎng)絡基礎設施建設、實現(xiàn)實時數(shù)字孿生效果、路側數(shù)據(jù)上車應用,提供關鍵支撐,成為城市和交通高效運行的‘AI數(shù)字基座’?!?/p>
從功能上看,通過全域覆蓋的通感算一體化設備,MogoMind不僅能識別路面狀況、交通標識、障礙物的物理狀態(tài),還能將復雜的交通環(huán)境信息轉(zhuǎn)化為可理解、可執(zhí)行的智能決策建議,為交通管理部門和出行者提供應對方案。
因此,MogoMind將擔當起城市交通決策中樞、車輛行駛多能助手、自動駕駛隱形基座三大角色。
這是智能交通從分散感知向系統(tǒng)認知轉(zhuǎn)型的一次具體實踐,該模型的技術路徑與應用表現(xiàn),既體現(xiàn)了對現(xiàn)有交通痛點的回應,也暴露了行業(yè)發(fā)展中的共性瓶頸,為理解智能交通的演進階段提供了實際參考。
架構改進與現(xiàn)實邊界
傳統(tǒng)交通感知體系長期依賴單點設備,形成難以打通的信息孤島。
路口監(jiān)控攝像頭受限于鏡頭角度,僅能覆蓋周邊有限范圍,無法捕捉遠距離車輛變道等動態(tài)行為;路段測速雷達功能單一,僅能記錄瞬時車速,缺乏對車輛類型、行駛軌跡的識別能力。
更突出的問題是,不同廠商設備遵循各自的數(shù)據(jù)標準,采集信息格式差異顯著,導致交通管理部門在整合數(shù)據(jù)時需投入大量精力做格式轉(zhuǎn)換與校準,難以形成全局交通圖景,應對早晚高峰擁堵、突發(fā)事故等復雜場景時往往被動應對。
從公開資料看,MogoMind的通感算一體化網(wǎng)絡對此做了改進。
該模型構建的多模態(tài)傳感器協(xié)同體系,將激光雷達、高清攝像頭、毫米波雷達的功能做了有機結合:激光雷達負責構建道路環(huán)境三維模型,精準捕捉目標位置關系;高清攝像頭專注識別視覺細節(jié),如信號燈狀態(tài)、車牌信息及行人姿態(tài);毫米波雷達則在雨霧等惡劣天氣下保持穩(wěn)定的測速能力。
這些傳感器若被系統(tǒng)部署于燈桿、交通崗亭等關鍵位置,就能形成連續(xù)感知網(wǎng)絡,數(shù)據(jù)通過統(tǒng)一接口傳輸,從源頭解決格式兼容問題。
在數(shù)據(jù)融合環(huán)節(jié),算法對不同傳感器信息做交叉驗證:當攝像頭因強光出現(xiàn)識別誤差時,激光雷達數(shù)據(jù)可做修正,有效提升了復雜路口交通參與者軌跡識別的準確性。
但這種改進存在明確邊界:郊區(qū)路段受設備部署與維護成本限制,感知網(wǎng)絡覆蓋密度很可能出現(xiàn)顯著下降。
城市核心區(qū)人口密集、交通流量大,傳感器部署效益可覆蓋成本;而郊區(qū)道路里程長、流量小,同等密度部署需數(shù)倍投入,導致目前鄉(xiāng)道等偏遠路段仍依賴傳統(tǒng)設備,形成城鄉(xiāng)結合部數(shù)據(jù)斷層。
車輛從城區(qū)駛入郊區(qū)時,感知數(shù)據(jù)精度與更新頻率明顯下降,直接限制了該模型的作用范圍。當然,不能指望一種模型能解決所有場景和成本問題。
MogoMind對路面摩擦系數(shù)的推算功能,試圖通過樣本車輛數(shù)據(jù)實現(xiàn)對道路物理狀態(tài)的精準感知。
這一功能的核心矛盾在于對樣本數(shù)量的高度依賴,存在實際場景中車輛分布不均的沖突:在車流量充足時段,模型能較好完成推算;而在車流量稀少時段,推算準確性下降。
凌晨等低峰時段,道路樣本車輛密度極低,數(shù)據(jù)稀疏成為物理信息采集的現(xiàn)實瓶頸。
交通系統(tǒng)需要24小時不間斷運行,即使車流量稀少時段,也可能出現(xiàn)暴雨、結冰等突發(fā)情況,亟需模型提供準確路面信息,但樣本不足導致模型難以有效發(fā)揮作用,形成難以通過算法優(yōu)化解決的“時間盲區(qū)”。
交通狀態(tài)模擬功能則受限于人類行為的不確定性。
交通系統(tǒng)包含大量受情緒、群體心理等非結構化因素影響的人類行為,在大型活動散場等場景中,行人行為具有顯著隨機性,其背后的影響因素難以轉(zhuǎn)化為模型可識別參數(shù),導致預測準確率驟降,凸顯了當前AI在理解人類復雜行為時的固有局限。
落地現(xiàn)實梗阻與根源
在城市交通管理中,模型與實際需求的錯位本質(zhì),是算法邏輯與社會邏輯的割裂。
MogoMind是以提升通行效率為核心目標的優(yōu)化方案,可能在提高主干道通行效率的同時,忽視學校周邊等區(qū)域?qū)Π踩?、公平的特殊需求?/p>
比如這個模型基于效率優(yōu)先的信號燈配時調(diào)整,可能縮短人行橫道綠燈時間,增加學生過馬路的安全風險。
如何將安全、公平等社會價值量化為模型可處理的指標,既是行業(yè)共性問題,也是MogoMind未來技術迭代的方向。
在自動駕駛車路協(xié)同應用中,傳輸延遲問題,主要源于電磁波傳播速度與車輛運動速度的客觀差距。
即使采用先進通信技術,數(shù)據(jù)從路側系統(tǒng)傳輸至車輛并完成處理,仍會產(chǎn)生一定延遲。
在緊急場景中,這種延遲可能影響車輛避險決策,因此車路協(xié)同必須依賴車載傳感器與路側系統(tǒng)的“雙重冗余”設計。
這種設計現(xiàn)實需求,雖然增加了系統(tǒng)復雜性與成本,但在當前技術條件下是保障安全的必要選擇。
MogoMind的核心價值,不在于提供成熟解決方案,而在于其暴露的問題為行業(yè)指明了技術突破方向:需同時攻克物理信息采集盲區(qū)、人類行為建模盲區(qū)與多目標平衡盲區(qū)三大難關。
解決這些問題需要跨學科融合創(chuàng)新:破解人類行為建模難題,需交通工程師與社會學家合作總結行為規(guī)律。
比如突破物理采集盲區(qū),依賴低成本、低功耗傳感器研發(fā)與邊緣計算技術應用;平衡多目標則需要政策制定者、管理者與算法專家協(xié)作,將社會價值轉(zhuǎn)化為可量化指標。
作為智能交通領域的探索者,MogoMind的實踐證明了通感算一體化的可行性,也讓行業(yè)認識到智能交通發(fā)展需與城市規(guī)劃、社會治理深度融合。
蘑菇車聯(lián)官方消息稱MogoMind是“首個物理世界認知模型”,其“首個”的全部價值,并不限于商業(yè)層面——就技術角度看,這個模型暴露的短板,也為后續(xù)研發(fā)標出了攻堅坐標,這將推動智能交通在漸進式探索中不斷前進。
來源:紅網(wǎng)
作者:百秀慧
編輯:敬夢凡
本文為紅辣椒評論 原創(chuàng)文章,僅系作者個人觀點,不代表紅網(wǎng)立場。轉(zhuǎn)載請附原文出處鏈接和本聲明。