近日,阿里巴巴集團(tuán)旗下的高德地圖宣布全面AI化,基于超二十年的數(shù)據(jù)、技術(shù)和場景研發(fā)經(jīng)驗(yàn)積累,推出了全球首個(gè)AI原生地圖應(yīng)用:高德地圖2025,即日起用戶升級(jí)高德地圖APP至最新版,搜索“空間智能”,即可體驗(yàn)。
該旗艦版本旨在融合AI技術(shù),把地圖導(dǎo)航服務(wù)體驗(yàn)推升至另一次元,演進(jìn)為具備深度時(shí)空理解和自主推理決策能力的出行生活智能體,將空間智能普及至瞬息萬變的現(xiàn)實(shí)場景。
“不同于語言智能,空間智能是在三維空間和時(shí)間中感知、推理、和行動(dòng)的能力,也意味著我們對(duì)‘連接真實(shí)世界’的使命演繹,將進(jìn)一步躍遷至‘理解’真實(shí)世界?!备叩碌貓DCEO郭寧表示,希望從高德地圖2025開始,推動(dòng)AI從“對(duì)話工具”蛻變?yōu)椤靶袆?dòng)伙伴”。
高德空間智能:從“連接”到“理解”,地圖里的另一個(gè)世界
空間智能,是一套構(gòu)建虛擬世界并深度理解、推理決策、總結(jié)輸出的AI技術(shù)分支,以實(shí)現(xiàn)虛擬數(shù)字世界與真實(shí)物理世界的無縫互聯(lián),被行業(yè)普遍認(rèn)為是通向AGI(通用人工智能)的關(guān)鍵。
而另一方面,地圖就是對(duì)真實(shí)世界虛擬化、數(shù)字化的最大載體,高德也是全球范圍處理定位、點(diǎn)云和視覺等時(shí)空信息規(guī)模最大的科技公司之一??臻g智能的發(fā)展驅(qū)動(dòng),與高德地圖“連接真實(shí)世界,讓出行和生活更美好”的使命不謀而合,也構(gòu)成了高德AI空間智能系統(tǒng)的核心定位:
通過深度感知視覺、音頻、文本、定位等多模態(tài)信息,理解真實(shí)時(shí)空環(huán)境的三維幾何結(jié)構(gòu),以及人、車、路、店等核心要素的行為和狀態(tài),再通過強(qiáng)大的時(shí)空推理能力預(yù)測變化,調(diào)用豐富多樣的工具鏈,生成當(dāng)下最優(yōu)的決策反饋或規(guī)劃行動(dòng),呈現(xiàn)提供給用戶。
郭寧認(rèn)為,高德超二十年的物理世界數(shù)據(jù)生產(chǎn)和技術(shù)積累,為三維虛擬世界一體化的理解和生成,提供了源源不斷的動(dòng)能。高德不僅要“連接”世界,更要“理解”這個(gè)物理世界如何運(yùn)轉(zhuǎn),從而實(shí)現(xiàn)被動(dòng)感知到主動(dòng)預(yù)判的跨越,調(diào)用工具鏈進(jìn)行有效行動(dòng)?!俺巳谌階PP,高德空間智能還將助力智能汽車、智能眼鏡、具身智能、低空飛行等領(lǐng)域的徹底躍遷,達(dá)成‘AMAP-AIInside’戰(zhàn)略.”
據(jù)介紹,在該開放戰(zhàn)略之下,智能眼鏡、汽車、機(jī)器人、低空飛行領(lǐng)域已有多家合作伙伴接入高德空間智能。
深度推理的“小高老師”:專精出行生活的智能體
高德地圖2025中,包含了業(yè)內(nèi)首個(gè)專精出行生活的智能體“小高老師”——一個(gè)通過主動(dòng)搜索對(duì)話和被動(dòng)推薦引導(dǎo)構(gòu)建的統(tǒng)一智能體框架:
可基于視覺、音頻、文本輸入等多模態(tài)方式,與用戶直觀交互,并全局高效的調(diào)度高德內(nèi)部近百量級(jí)工具進(jìn)行處理,從而將內(nèi)外部數(shù)據(jù)和工具,輸出總結(jié)生成最佳為回答反饋和地圖交互動(dòng)作。
從小高老師的內(nèi)部原理看,一個(gè)完整運(yùn)作流程可分為四個(gè)主要階段:
1)需求感知:通過感知用戶的動(dòng)態(tài)行為(視覺、語音、文本輸入等)和靜態(tài)狀態(tài)(定位及周邊時(shí)空感知)變化,并結(jié)合環(huán)境上下文的時(shí)序變化和實(shí)時(shí)特征(如歷史時(shí)序行為、當(dāng)前路況天氣信息等),全方位理解用戶真實(shí)需求。
2)思考決策:基于感知處理后的信息,主智能體可主動(dòng)進(jìn)行多輪推理、規(guī)劃、執(zhí)行和反思的循環(huán),通過MCP協(xié)同調(diào)用最合適的子智能體和特色工具,并整合內(nèi)外部不同渠道的知識(shí)庫,匯總最終可提供給用戶的豐富信息和行動(dòng)建議。
3)總結(jié)生成:智能體集合用戶的個(gè)性化需求、當(dāng)前時(shí)空環(huán)境和服務(wù)特性,將思考決策階段匯總的豐富信息和行動(dòng)建議,加以綜合理解和總結(jié),并生成最終答案、信息匯總以及可執(zhí)行的行動(dòng)方案。這些總結(jié)信息和決策行動(dòng)方案,也將通過地圖場景的特有多模態(tài)方式返回給用戶。
4)場景交付:通過高德APP中多種創(chuàng)新界面和交互場景,比如AI領(lǐng)航、AI即刻、AI探索等,將總結(jié)信息和決策方案的最終結(jié)果呈現(xiàn)給用戶,并實(shí)時(shí)收集反饋。而這些反饋信息,也將通過強(qiáng)化學(xué)習(xí)機(jī)制持續(xù)優(yōu)化模型,形成一個(gè)高效的智能服務(wù)體驗(yàn)優(yōu)化閉環(huán)。
據(jù)悉,支持這一整套智能體架構(gòu)的高德和通義共建大模型簇,由多模態(tài)空間感知、行為認(rèn)知、時(shí)空意圖理解、總結(jié)輸出交互和反饋觀測評(píng)估等多個(gè)專業(yè)模型構(gòu)成。
而在其背后,考慮到多場景智能體的用戶調(diào)用體量和計(jì)算復(fù)雜性,需有充足的算力和服務(wù)資源作為保障。除了大模型本身的推理優(yōu)化外,整個(gè)框架也考慮了算力分級(jí)調(diào)度分配體系,根據(jù)場景和應(yīng)用差異,組合應(yīng)用離線、在線、cache等算力分配方案,并在不同應(yīng)用環(huán)節(jié)選擇不同參數(shù)規(guī)模的模型,以達(dá)成用戶體驗(yàn)、延遲和算力成本的最佳匹配。
其中還有許多挑戰(zhàn),相關(guān)的技術(shù)實(shí)現(xiàn)也都是業(yè)界首創(chuàng),使得“小高老師”能夠更加順暢地支持多智能體架構(gòu),調(diào)用各類子智能體進(jìn)行深度交互,包括負(fù)責(zé)導(dǎo)航體驗(yàn)的“出行服務(wù)智能體”、滿足基于生活需求的“生活服務(wù)智能體”,以及連接虛擬與現(xiàn)實(shí)的“空間服務(wù)智能體”。
AI原生高德地圖:10億人的AI出行助手
高德地圖2025作為AI原生化應(yīng)用,致力于重塑人們在行前、行中、行后,與物理世界的交互方式。
例如用戶可以用語音向小高老師提問:“帶著孩子和老人去杭州的三天旅行計(jì)劃”。小高老師就能精準(zhǔn)解析需求,基于模型能力推理思考后調(diào)用出行服務(wù)子智能體,將完整解決方案提供給用戶,用選擇相應(yīng)目的地后即可一鍵查看路線,導(dǎo)航前往。
最新的AI領(lǐng)航應(yīng)用創(chuàng)新技術(shù)理念和架構(gòu),賦予系統(tǒng)超越物理視野的超視距感知能力,向用戶提供北斗車道級(jí)安全預(yù)警、紅綠燈AI領(lǐng)航、盲區(qū)會(huì)車預(yù)警等服務(wù),實(shí)現(xiàn)更精準(zhǔn)安心的駕車導(dǎo)航體驗(yàn)。
上述出行服務(wù)智能體功能之外,高德地圖2025還整合了基于時(shí)空信息推薦目的地的生活服務(wù)智能體功能。例如AI即刻,能夠結(jié)合當(dāng)下位置,即時(shí)洞悉用戶出行需求,如傍晚推送附近的特色餐飲店,讓用戶享受基于真實(shí)導(dǎo)航的精準(zhǔn)推薦;AI探索則著力于挖掘更廣泛時(shí)空的潛在目的地——在更長時(shí)間、更大地理的范圍,呈現(xiàn)用戶感興趣的且同樣反映真實(shí)到店?duì)顩r的目的地,如“周末城郊親子民宿”。
空間服務(wù)智能體中的AR打卡,則基于計(jì)算機(jī)視覺與空間定位技術(shù),將數(shù)字信息無縫疊加于真實(shí)世界之上,提供虛實(shí)結(jié)合的沉浸式城市探索與生活記錄體驗(yàn),進(jìn)一步提升了地圖與空間智能的融合深度。
郭寧表示,未來高德將繼續(xù)推動(dòng)空間智能服務(wù)的演進(jìn),成為廣大用戶與真實(shí)世界交互的觸點(diǎn)?!坝酶顚哟蔚摹斫狻?,實(shí)現(xiàn)‘讓出行和生活更美好’的愿景?!?/p>
原標(biāo)題:《全面轉(zhuǎn)向空間智能,高德發(fā)布全球首個(gè)基于地圖的AI原生智能體》
欄目主編:李吉文字徐卓人
來源:作者:卓凝
延伸閱讀:與 高德發(fā)布{全球首個(gè)}基于地圖的A:I、原生智能體 的相關(guān)文章