“晚上喝一杯慶祝?”“不了,我還要加班呢?!?/p>
在“2025世界人工智能大會暨人工智能全球治理高級別會議”(WAIC2025)騰訊論壇上,騰訊首席科學(xué)家、RoboticsX實(shí)驗室主任、福田實(shí)驗室主任張正友與宇樹科技人形機(jī)器人G1進(jìn)行了上述這段即興對話,并非預(yù)設(shè)程序。
彼時,人形機(jī)器人G1在舞臺上行走退場,接到張正友的提問后,稍作“思索”便給出了如上回應(yīng)。這并非提前編寫好的固定腳本,而是機(jī)器人基于實(shí)時理解和自主決策做出的回答。
張正友告訴《每日經(jīng)濟(jì)新聞》記者:“這是我第一次聽到它(人形機(jī)器人G1)回答晚上還要加班”。過往絕大多數(shù)機(jī)器人的現(xiàn)場表演都是提前設(shè)定好的,張正友則要求這次跟機(jī)器人的互動必須是Live(現(xiàn)場演繹)的形式,所以在測試、彩排直到現(xiàn)場正式表演的時候,機(jī)器人的回答每次都不一樣。
騰訊首席科學(xué)家、RoboticsX實(shí)驗室主任、福田實(shí)驗室主任張正友class="blackWords主席">主席兼首席執(zhí)行官馬化騰已用清晰的坐標(biāo)錨定了騰訊在具身智能領(lǐng)域的定位——騰訊希望成為所有機(jī)器人廠商的合作伙伴,而不是取而代之做硬件。
騰訊亮出AI“全家桶”“智能體是大模型落地的關(guān)鍵形態(tài)”在WAIC2025上,互聯(lián)網(wǎng)大廠紛紛亮出AI(人工智能)新產(chǎn)品或技術(shù),騰訊也不例外。其發(fā)布了混元3D世界模型、具身智能開放平臺Tairos等AI最新成果,還一口氣推出了10余個垂直智能體(Agent),這也是騰訊首次向外界展示AI應(yīng)用全景圖。
當(dāng)大模型從“技術(shù)炫技”轉(zhuǎn)向“能力沉淀”,互聯(lián)網(wǎng)大廠的下一個戰(zhàn)場已瞄準(zhǔn)“智能體”。對大廠而言,智能體是“技術(shù)—場景—商業(yè)”的最短連接點(diǎn)。大模型解決了“知道什么”,智能體則回答“如何做到”。
7月27日,騰訊云副總裁、騰訊云智能及騰訊優(yōu)圖實(shí)驗室負(fù)責(zé)人吳運(yùn)聲在接受《每日經(jīng)濟(jì)新聞》記者現(xiàn)場采訪時表示,智能體是推動大模型技術(shù)在產(chǎn)業(yè)界落地并產(chǎn)生實(shí)際價值的重要形態(tài)。大模型的終極目標(biāo)是解決現(xiàn)實(shí)問題,但落地過程中會遇到諸多具體難題,探索適配的形態(tài)與方案正是行業(yè)演進(jìn)的重要方向,而智能體恰好提供了這樣一種理想模式。
騰訊云副總裁、騰訊云智能及騰訊優(yōu)圖實(shí)驗室負(fù)責(zé)人吳運(yùn)聲“機(jī)器人還沒到‘大哥大時代’”
在WAIC2025騰訊展區(qū),搭載了具身智能開放平臺Tairos的宇樹人形機(jī)器人G1已經(jīng)上崗,可以給到場觀眾當(dāng)“導(dǎo)游”;人居環(huán)境機(jī)器人“小五”聽懂了人類的語言,可以跟現(xiàn)場觀眾擁抱;而來自越疆的機(jī)械臂X-Trainer通過接入Tairos,也可以做到“動動嘴就讓機(jī)器人給你做好飯”。
在張正友看來,具身智能的落地,遠(yuǎn)不僅僅是一個算法問題,或者一個模型能力的問題,而是一個極其復(fù)雜、環(huán)環(huán)相扣的系統(tǒng)工程挑戰(zhàn),需要打通數(shù)據(jù)、訓(xùn)練、調(diào)試、部署的全鏈條。從基礎(chǔ)模型到真機(jī)部署,每一個環(huán)節(jié),都藏著不少“坑”。
騰訊從去年底開始規(guī)劃Tairos,團(tuán)隊先認(rèn)真調(diào)研了行業(yè),累計到現(xiàn)在差不多跑過60多家機(jī)器人企業(yè)。他們發(fā)現(xiàn),中國大量的機(jī)器人企業(yè)可以把硬件做得很好,但在軟件能力上還需要補(bǔ)齊。
騰訊對于Tairos的定位是平臺:為機(jī)器人本體開發(fā)商與應(yīng)用開發(fā)商補(bǔ)齊關(guān)鍵的軟件能力,接下來,Tairos平臺會對所有機(jī)器人硬件公司開放合作,也對各領(lǐng)域模型開放算法接入能力,讓開發(fā)者可以在平臺上自由組合創(chuàng)新。對騰訊而言,他們在某些方面需要跟機(jī)器人本體廠家、硬件廠家一起打磨具身智能技術(shù)。
張正友介紹道,Tairos的核心是三個緊密結(jié)合的大模型,類似于人類大腦:規(guī)劃大模型相當(dāng)于人的左腦,讓機(jī)器人能理解復(fù)雜目標(biāo)是什么,然后拆解成一個個可執(zhí)行的策略步驟;感知大模型相當(dāng)于人的右腦,讓機(jī)器人真正了解自己所處的環(huán)境;感知行動聯(lián)合大模型相當(dāng)于人的小腦,打通了從“看見”到“做到”的關(guān)鍵環(huán)節(jié)。
“VLA(視覺語言動作模型)或者感知行動大模型目前只是初級階段,機(jī)器人具身智能行業(yè)也還是剛剛起步?!睆堈烟寡裕呱碇悄苓€有很長的路需要走,類比手機(jī)發(fā)展階段的話,機(jī)器人現(xiàn)在還沒有到“大哥大時代”?!按蟾绱髸r代”用戶基本是偏有錢的,但人數(shù)還比較多?,F(xiàn)在機(jī)器人還沒有到那個程度,因為現(xiàn)在大部分機(jī)器人還是用來做數(shù)據(jù)采集、科研、導(dǎo)覽。
因此,張正友他們希望利用Tairos平臺能夠助力行業(yè)進(jìn)入到“大哥大時代”。他認(rèn)為在養(yǎng)老場景可能會先達(dá)成,但是也有人認(rèn)為在工業(yè)領(lǐng)域可能更早起來?!暗遣还茉趺礃樱切枰幸粋€領(lǐng)域或場景,它要足夠大,這樣能量產(chǎn)的數(shù)量也比較大,成本降下來、生產(chǎn)穩(wěn)定下來,才能進(jìn)入到每家每戶。”
為西安代言 電影《長安假日》正式啟動