炒股就看金麒麟分析師研報,權(quán)威,專業(yè),及時,全面,助您挖掘潛力主題機(jī)會!
來源:北京商報
7月的最后一個周末,2025世界人工智能大會(WAIC)吸引了800多家企業(yè)參加,宇樹人形機(jī)器人跳舞、格斗的畫面登上多家媒體頭版C位,智能眼鏡展臺排隊體驗的觀眾拐了好幾個彎。同時舉行的100多場論壇中,“智能體”成為高頻詞,智能體與大模型的關(guān)系、智能體的落地路徑,從業(yè)者一邊分享方法論一邊觀點碰撞。
“能思考會做事”,不管是線上應(yīng)用還是具身硬件,2025年的AI以實用為目標(biāo)。2025WAIC期間,北京商報記者與科技大廠、智能硬件、垂直賽道等領(lǐng)域高管進(jìn)行了交流,通過他們的視角,一條人工智能發(fā)展的脈絡(luò)逐漸清晰。當(dāng)觀眾們?yōu)殇撹F之軀按下快門,更新了植入智能體的新版App,下一個行業(yè)爆款的種子已悄然埋下。
智能體與大模型不可類比
大模型基礎(chǔ)能力的成熟,讓智能體以極快的速度成為標(biāo)配,大模型的風(fēng)頭似乎要被取代。事實上智能體與大模型不可類比,前者是應(yīng)用范疇,后者屬于基礎(chǔ)底層技術(shù)支持,toC(用戶)智能體與toB(企業(yè))智能體的打造邏輯也不盡相同。
騰訊云副總裁吳運聲
不會“曇花一現(xiàn)”
簡單用“放大”或“縮小”大模型的價值來定義智能體不合適,智能體實際上是大模型技術(shù)落地在具體行業(yè)、產(chǎn)生價值的一個重要形態(tài)。
大模型最終是要落地解決問題的,這個過程會出現(xiàn)很多問題。我們需要思考用什么形態(tài)、什么解決方案去解決,智能體就是一個很好的形態(tài)。
我認(rèn)為這種智能體形態(tài)不會短期存在,會是長期的。因為它(智能體)能自動思考、決策、進(jìn)行環(huán)境感知、選擇工具,甚至能自動創(chuàng)造工具再進(jìn)行工具調(diào)用,出現(xiàn)了一些嶄新的、大模型原生時代所體現(xiàn)的應(yīng)用特點。智能體和行業(yè)大模型也不是取代的關(guān)系,我們的目標(biāo)始終是用技術(shù)服務(wù)產(chǎn)業(yè),無非是通過怎樣的方式去服務(wù)。
想要達(dá)到智能體什么都能干,并且能干得很好的理想狀態(tài),需要模型、工程、框架、性能調(diào)優(yōu)、數(shù)據(jù)等全環(huán)節(jié)高速發(fā)展。這會是一個長期迭代發(fā)展的過程。
金山辦公助理總裁田然
只對接API遠(yuǎn)遠(yuǎn)不夠
AI必須和軟件做深度的融合才能提供最佳的用戶體驗。比如辦公場景,融合不是簡單地給軟件的1萬個API(應(yīng)用程序編程接口)“教給”AI,一方面API學(xué)不會,它沒法學(xué)習(xí)經(jīng)過大量訓(xùn)練的網(wǎng)絡(luò)信息,它有自己的編程語言。把流程反過來,從AI到API也不行,AI沒辦法把自己真正擅長的寫進(jìn)文檔里,方便用戶去做增減項。
現(xiàn)在AI辦公正在向AgenticSoftware(代理式軟件,即更強(qiáng)大更智能的軟件)演進(jìn),從業(yè)者要做的是針對場景做AI和軟件的雙向改造,AI軟件化的改造是指教會AI用軟件,要用一套專門為AI設(shè)計的API,軟件也要為AI設(shè)計專有的能力,最終依靠用戶、軟件、AI之間多輪交流,輸出真正可用的內(nèi)容。
技術(shù)層面之外,產(chǎn)品可以以助理的形式設(shè)計,允許用戶跟AI持續(xù)討論,產(chǎn)出想要的內(nèi)容,這樣可以大幅降低大眾使用AI的門檻,行業(yè)將迎來“人人都有AI助理”的時代。
阿里云無影總裁張獻(xiàn)濤
需要“拎包入住”的開發(fā)環(huán)境
本地設(shè)備就像一位“螞蟻搬家”的苦力,難以支撐高并發(fā)、高算力需求的智能體任務(wù),尤其是需要大量GPU(圖形處理器)運算的工作,普通辦公電腦根本“hold不住”。同時,智能體執(zhí)行任務(wù)時往往會占用本地計算資源和操作權(quán)限,嚴(yán)重影響體驗。
云電腦的技術(shù)原理天然解決了這一難題,通過構(gòu)建智能體操作系統(tǒng),讓開發(fā)更加簡單,將AI分配的任務(wù)直接接入高性能的云端環(huán)境。它不僅自帶MCP(模型上下文協(xié)議)工具和環(huán)境,還能在云端輕松完成任務(wù)執(zhí)行、算力彈性擴(kuò)容,全程可視化,讓運行時間大幅“瘦身”。
就像互聯(lián)網(wǎng)催生App生態(tài),云端環(huán)境支持彈性算力,有豐富的生態(tài),可以便捷部署,開發(fā)者可以“拎包入住”。傳統(tǒng)的操作系統(tǒng)分成基礎(chǔ)層、內(nèi)核層、用戶界面層。我們認(rèn)為只有這樣分層,不同的公司根據(jù)自己所長研究不同的層,才能改善智能體開發(fā)遇到的問題。
具身智能最新能力是焦點
大模型與機(jī)械的融合,讓機(jī)器人從預(yù)編程機(jī)械臂進(jìn)化為能感知、會思考的具身智能體,傳統(tǒng)機(jī)器人的產(chǎn)業(yè)格局正被重塑。2025年,具身智能的代表形態(tài)人形機(jī)器人收獲了極大的關(guān)注度,超150臺人形機(jī)器人亮相2025WAIC,落地情況、最新能力等是關(guān)注焦點。
商湯科技董事長兼CEO徐立
機(jī)器人要看懂、會懂、能交互
人工智能發(fā)展的下一階段是去跟世界交互,一是跟世界交互可以獲得更多的數(shù)據(jù),人類從小的學(xué)習(xí)方式就是先跟世界做交互;二是人工智能要真正成為生產(chǎn)力,需要走進(jìn)實體的世界中。
也就是說,人類的學(xué)習(xí)天生是多模態(tài)的,多模態(tài)能夠解決生產(chǎn)力工具和交互工具的問題,多模態(tài)對于世界的理解賦能了具身智能行業(yè),具身智能的核心是大腦,即VLA(視覺語言動作模型),世界模型可以很好地幫助機(jī)器人和世界交互。
視覺感知讓機(jī)器人識別和理解世界萬物,視覺導(dǎo)航可以做路徑規(guī)劃,基于規(guī)劃自主導(dǎo)航,交互也非常重要,機(jī)器人會經(jīng)歷從交互工具到交互伙伴的演變,可以調(diào)試機(jī)器人的風(fēng)格,可以回答、被打斷,可以進(jìn)行全局記性、隨時交互。
梅卡曼德創(chuàng)始人兼CEO邵天蘭
下一個風(fēng)口是“能干活”
“硅基生命”正通過AI智能終端、智能網(wǎng)聯(lián)汽車、智能機(jī)器人等多元形態(tài)快速融入社會。兩三年前,大家還在熱衷于比拼自己的技術(shù)炫不炫酷。去年以來,大家開始轉(zhuǎn)向考慮如何結(jié)合場景落地應(yīng)用的問題。今年更明顯的感受是,行業(yè)不約而同地聚焦落地應(yīng)用,思考怎樣實現(xiàn)具身智能與場景相結(jié)合,讓場景結(jié)合時更安全、高效、可靠等問題?!澳芨苫睢?,是具身智能下一步要干的事。
比如鈑金件是汽車制造中的重要零部件,應(yīng)用于車身結(jié)構(gòu)件、覆蓋件和功能部件等。梅卡曼德的AI視覺系統(tǒng)能夠應(yīng)對鈑金件反光、異形、亂序堆疊等復(fù)雜工況,在大于3米的距離下精準(zhǔn)識別鈑金件及其關(guān)鍵特征,視覺精度達(dá)±0.5毫米。AI視覺引導(dǎo)鈑金件深筐無序上料是真實的應(yīng)用場景,智能筐內(nèi)路徑規(guī)劃+抓取規(guī)劃,能有效應(yīng)對深筐、工件貼邊/貼角等問題,提升深筐抓取成功率及清筐率。如果沒有真實的落地,一切技術(shù)只是想象。
XREAL聯(lián)合創(chuàng)始人吳克艱
和智能眼鏡結(jié)合是必然趨勢
眼鏡有便攜性,可以連接互聯(lián)網(wǎng)、操作App,但眼鏡不能在現(xiàn)實生活中充當(dāng)勞動力,這部分工作可以由具身智能來提供。
眼鏡還可以實現(xiàn)視覺反饋,有了視覺反饋,就可以向人類實時推送一些信息,比如視覺影像、定位等。為什么現(xiàn)在具身智能這么火?是因為人工智能賦能機(jī)器人,可以讓機(jī)器人替人類去做更多事情。眼鏡可以解決人與人、人與具身智能交互的問題,人類也可以通過智能眼鏡操控具身智能。
只要眼鏡和具身智能聯(lián)網(wǎng),有些功能已經(jīng)可以實現(xiàn),前提是具身智能落地到實際場景。不過技術(shù)轉(zhuǎn)化成產(chǎn)品,并且真正被社會接受,需要一定的過程。
延伸閱讀:與 退役軍人寇增文的三次華麗“轉(zhuǎn)身與時”代擔(dān):;當(dāng) 的相關(guān)文章