早在2700年前的古希臘神話中,工匠之神打造的青銅巨人Talos,已經(jīng)在克里特島上巡視、守衛(wèi)領(lǐng)土。它擁有自主意識(shí),被視為「最早的安保機(jī)器人」。
騰訊首席科學(xué)家張正友用這個(gè)故事作為演講的開(kāi)場(chǎng),人類(lèi)這種對(duì)機(jī)械智能體的渴望,從青銅鍛造爐一直延續(xù)到了今天的實(shí)驗(yàn)室。
這種渴望在今年的世界人工智能大會(huì)(WAIC)上,尤其強(qiáng)烈。
機(jī)器人領(lǐng)域尤其是人形機(jī)器人成為了絕對(duì)的焦點(diǎn)。世博展覽館二樓H3館尤為震撼,匯聚了包括上海智元、傅利葉、杭州宇樹(shù)科技、深圳樂(lè)聚、北京人形機(jī)器人中心等十余家公司的超百臺(tái)人形機(jī)器人。
當(dāng)人形機(jī)器人以前所未有的熱度席卷科技圈,幾乎所有目光都聚焦于那個(gè)越來(lái)越像人的「新物種」時(shí),騰訊RoboticsX實(shí)驗(yàn)室卻選擇了一條看起來(lái)不那么「時(shí)髦」的路。
7月27日,在WAIC2025騰訊論壇上,他們正式發(fā)布了具身智能開(kāi)放平臺(tái)Tairos,一個(gè)代號(hào)「鈦螺絲」的軟件平臺(tái)。這是這家巨頭在長(zhǎng)達(dá)七年的前沿探索后,對(duì)產(chǎn)業(yè)階段、自身定位和未來(lái)路徑的一次深度思考與戰(zhàn)略選擇。
一、機(jī)器人的「iPhone時(shí)刻」遠(yuǎn)未到來(lái)
「現(xiàn)在的機(jī)器人行業(yè)大概處在什么階段?」
面對(duì)這個(gè)問(wèn)題,騰訊首席科學(xué)家、RoboticsX實(shí)驗(yàn)室主任張正友的回答很克制:「我覺(jué)得甚至其實(shí)還沒(méi)到‘大哥大’時(shí)代?!顾J(rèn)為,行業(yè)的「iPhone時(shí)刻」遠(yuǎn)未到來(lái),甚至可能還看不到iPhone的影子。
這個(gè)判斷,是理解騰訊如今所有選擇的邏輯基礎(chǔ)。
時(shí)間拉回2018年,RoboticsX實(shí)驗(yàn)室剛剛成立。張正友坦言,那時(shí)行業(yè)一片荒蕪,甚至找不到一家成熟的機(jī)器人本體廠商可以合作,團(tuán)隊(duì)不得不從硬件到軟件進(jìn)行全棧自研。
從多模態(tài)四足機(jī)器人Max到輪腿式機(jī)器人Ollie,再到人居環(huán)境機(jī)器人原型「小五」,這些一度令人驚艷的硬件原型,更多是實(shí)驗(yàn)室為了驗(yàn)證和牽引技術(shù)研發(fā)而「開(kāi)的坑」。它們是研究載體,而非產(chǎn)品線上的商品。
2023年成了分水嶺。
大模型的浪潮讓具身智能一夜之間從學(xué)界、業(yè)界走向公眾,資本和創(chuàng)業(yè)者蜂擁而入,機(jī)器人硬件公司瘋狂涌現(xiàn)。
騰訊團(tuán)隊(duì)在走訪了全國(guó)超過(guò)六十家機(jī)器人企業(yè)后發(fā)現(xiàn),一個(gè)巨大的市場(chǎng)缺口正在顯現(xiàn):大量企業(yè)能將硬件本體打磨得非常出色,但在軟件和智能上的投入?yún)s不足,因?yàn)檫@是一個(gè)需要長(zhǎng)期、巨大投入的無(wú)底洞。
具身智能的落地是一個(gè)極其復(fù)雜、環(huán)環(huán)相扣的系統(tǒng)工程。從需要巨大投入的基礎(chǔ)模型,到效率低下、成本高昂的場(chǎng)景數(shù)據(jù)采集,再到缺少流程化工具的訓(xùn)練仿真,以及令人「頭大」的真機(jī)部署和升級(jí),每一個(gè)環(huán)節(jié)都藏著不少「坑」。
市場(chǎng)的需求變化,讓騰訊看到了新的可能性。既然行業(yè)的「黑莓時(shí)代」才剛剛開(kāi)始,探索各種可能的硬件形態(tài)是所有玩家的必修課。那么,與其過(guò)早下注某一種具體的機(jī)器人形態(tài),不如退后一步,為所有「探索者」提供通用的「平臺(tái)」和「開(kāi)發(fā)工具」。
這便是Tairos平臺(tái)的由來(lái)。張正友反復(fù)向媒體強(qiáng)調(diào)「產(chǎn)品化」與「商業(yè)化」的區(qū)別?!肝覀兪遣毁嶅X(qián)的,‘鈦螺絲’這個(gè)平臺(tái)不是以賺錢(qián)為目的?!?/p>
他透露,實(shí)驗(yàn)室成立七年來(lái)一直不以收入為目標(biāo),這是一項(xiàng)著眼于未來(lái)的技術(shù)儲(chǔ)備和戰(zhàn)略投資。
在張正友看來(lái),真正的智能,必須是身體與智能的緊密結(jié)合、和諧交融。機(jī)器人的「心」(智能)必須知道「身」(本體)的狀態(tài)。
這種「身心合一」的追求,對(duì)應(yīng)他提出的一個(gè)關(guān)鍵技術(shù)理念——IPDE(IntegratedPhysical-DigitalEmbodiment),即「虛實(shí)集成智能體」——虛實(shí)世界和真實(shí)世界的無(wú)縫結(jié)合?!?/p>
機(jī)器人可以在數(shù)字世界里「想象」或「仿真」一個(gè)動(dòng)作,預(yù)判其在真實(shí)世界執(zhí)行的后果。如果想象的結(jié)果與真實(shí)執(zhí)行的預(yù)期偏差很大,那么機(jī)器人就必須修正自己的規(guī)劃。這種在虛擬中預(yù)演、在現(xiàn)實(shí)中修正的循環(huán),正是實(shí)現(xiàn)「身心合一」的技術(shù)路徑。
這種哲學(xué)思考并非一時(shí)興起,而是張正友長(zhǎng)期個(gè)人修行的沉淀。他談到自己正在第四遍翻譯《道德經(jīng)》,「每翻譯一遍,重新看一遍,我都有不同的啟發(fā)。」
而現(xiàn)在,時(shí)機(jī)成熟了,是時(shí)候?qū)⑦@些前沿的科研成果,變成一個(gè)可以賦能行業(yè)的標(biāo)準(zhǔn)化產(chǎn)品了。
二、解構(gòu)Tairos:為機(jī)器人注入「左腦、右腦和小腦」
如果說(shuō)行業(yè)的共識(shí)是為機(jī)器人打造一個(gè)聰慧的「大腦」,那么Tairos的目標(biāo)就是成為那個(gè)可以被靈活調(diào)用的「外腦」。它的核心設(shè)計(jì)理念是模塊化與完整性。
「每一個(gè)廠家可以選取他自己想要的模塊,」張正友解釋道,「比如他的感知做得很好,那就不需要我們的感知模塊。如果規(guī)劃做得不夠好,那就用我們的規(guī)劃模塊?!惯@種靈活性,大大降低了廠商的研發(fā)門(mén)檻。
這個(gè)「大腦」由三個(gè)核心模型和一套云端服務(wù)構(gòu)成,分別扮演著不同的角色。
右腦:多模態(tài)感知模型——讓機(jī)器人看懂3D世界這個(gè)模型致力于讓機(jī)器人真正理解自己所處的物理環(huán)境。
但張正友指出,這不僅僅是拍張照片然后重建3D模型那么簡(jiǎn)單?!负芏?D建模是‘死’的,所有東西都連在一起,」他解釋說(shuō),「但機(jī)器人需要知道,這個(gè)杯子是可以被抓取的,它是一個(gè)獨(dú)立實(shí)體?!筎airos的感知模型致力于構(gòu)建一個(gè)可交互的、語(yǔ)義化的三維世界地圖。
此外,它試圖擺脫當(dāng)前主流VLA(視覺(jué)-語(yǔ)言-行為)模型對(duì)海量2D圖像數(shù)據(jù)的過(guò)度依賴(lài)。張正友認(rèn)為,2D圖像缺少3D世界的深度信息,導(dǎo)致數(shù)據(jù)需求量極大?!笍?D角度看,一個(gè)杯子我只需要一個(gè)3D描述就夠了,數(shù)據(jù)效率會(huì)高很多?!?/p>
左腦:規(guī)劃大模型——讓機(jī)器人理解任務(wù)并思考如果說(shuō)感知是「看懂」,規(guī)劃就是「理解」和「思考」。這個(gè)模型能讓機(jī)器人理解復(fù)雜的指令,并將其拆解成一個(gè)個(gè)可執(zhí)行的步驟。
騰訊方面的數(shù)據(jù)顯示,在復(fù)雜的長(zhǎng)序列人機(jī)交互任務(wù)中,該模型的成功率達(dá)到了80%,超過(guò)了GPT-4o等領(lǐng)先的閉源系統(tǒng)。
張正友認(rèn)為,僅靠文本訓(xùn)練的大模型在物理世界規(guī)劃上存在天然缺陷?!脯F(xiàn)實(shí)世界很多東西是無(wú)法用文字描述的,比如地面的花紋、摩擦力,」他舉例說(shuō),「動(dòng)物沒(méi)有語(yǔ)言,但它們依然能在3D世界里很好地生存、覓食?!惯@說(shuō)明,對(duì)物理世界的深度理解,是比語(yǔ)言更底層的規(guī)劃基礎(chǔ)。
小腦:感知行動(dòng)聯(lián)合大模型——打通「看見(jiàn)」到「做到」這是最關(guān)鍵的閉環(huán),負(fù)責(zé)將「思考」轉(zhuǎn)化為精準(zhǔn)、安全的物理行動(dòng)。近來(lái),一些機(jī)器人失控的案例恰恰暴露了這一環(huán)節(jié)的脆弱,比如一個(gè)機(jī)器人被懸空吊起后瘋狂亂動(dòng)——張正友分析根本原因在于機(jī)器人缺乏對(duì)自身狀態(tài)的感知——它不知道自己雙腳已離地,沒(méi)有了摩擦力,卻仍在執(zhí)行地面行走的動(dòng)作模式,從而導(dǎo)致失控。
Tairos的「小腦」模型,正是要將力覺(jué)、觸覺(jué)等多模態(tài)感知信息融合進(jìn)來(lái),形成對(duì)物理規(guī)律的深度理解,從而讓行動(dòng)更智能、更安全。
除了三大模型,Tairos還提供了一整套云端仿真平臺(tái)和開(kāi)發(fā)工具鏈。通過(guò)騰訊游戲級(jí)別的3D場(chǎng)景生成技術(shù),開(kāi)發(fā)者可以在云端高保真環(huán)境中一鍵驗(yàn)證算法,解決傳統(tǒng)仿真工具部署復(fù)雜、場(chǎng)景單一的痛點(diǎn)。
三、超越人形熱:探索人機(jī)共存的更優(yōu)形態(tài)
在WAIC論壇現(xiàn)場(chǎng),搭載了Tairos平臺(tái)的宇樹(shù)G1機(jī)器人與張正友的互動(dòng),成為了平臺(tái)能力最直觀的證明。
當(dāng)張正友說(shuō)「到我身邊來(lái)」時(shí),機(jī)器人自主規(guī)劃路徑并準(zhǔn)確地停在他身旁;當(dāng)被問(wèn)及「講臺(tái)上有什么」時(shí),它能清晰地回答「一個(gè)電腦,一束花,兩個(gè)麥克風(fēng)」。
整個(gè)過(guò)程全部由算法驅(qū)動(dòng),沒(méi)有任何人為遙控?,F(xiàn)場(chǎng)一位工作人員透露,由于是實(shí)時(shí)演算,機(jī)器人每天的回答和表現(xiàn)都可能不一樣,充滿(mǎn)了算法帶來(lái)的「驚喜」。
盡管人形機(jī)器人是當(dāng)下的絕對(duì)主角,但張正友對(duì)此卻保持著審慎和開(kāi)放的態(tài)度。他認(rèn)為,過(guò)早地將終極形態(tài)鎖定在「人形」上,可能會(huì)限制行業(yè)的想象力。
他給出了三個(gè)理由:
效率問(wèn)題:人類(lèi)的進(jìn)化形態(tài)是為了適應(yīng)數(shù)百萬(wàn)年前的復(fù)雜自然環(huán)境,但在現(xiàn)代人居的平坦環(huán)境中,雙足行走的效率并不高。這正是騰訊早期探索「輪腿一體」機(jī)器人Max和Ollie的原因,他們追求的是效率,而非單純的仿生。想象力限制:以人為藍(lán)本,會(huì)不自覺(jué)地限制技術(shù)潛力的發(fā)揮。「人不可能進(jìn)化出一個(gè)屏幕,」他舉例道,「但機(jī)器人可以。通過(guò)屏幕,信息傳遞速度可以比語(yǔ)音快幾倍,為什么不利用這些現(xiàn)代技術(shù)呢?」本體探索仍需過(guò)程:什么才是最適合人居環(huán)境的機(jī)器人形態(tài)?這依然是一個(gè)開(kāi)放性問(wèn)題。因此,Tairos平臺(tái)的設(shè)計(jì)是本體無(wú)關(guān)的,無(wú)論是雙足、四足還是機(jī)械臂,都可以接入并獲得其賦能。對(duì)于具身智能的未來(lái),張正友判斷將在五個(gè)方向上持續(xù)發(fā)展,并將其總結(jié)為「IDEAS」框架:虛實(shí)集成世界(IPhD):數(shù)字世界與真實(shí)世界的深度融合與相互影響。技術(shù)門(mén)檻降低(Democratization):交互方式的演進(jìn)使得人人都能輕松與機(jī)器打交道。智能演進(jìn)(Evolvingintelligence):AI、本體、環(huán)境一體化互動(dòng),加速產(chǎn)業(yè)創(chuàng)新。智能體化(Agentization):AI從被動(dòng)系統(tǒng)演進(jìn)到主動(dòng)交互的智能體,并可能涌現(xiàn)集體智能。感知拓展(Sensing):感知技術(shù)從單一視覺(jué)向視覺(jué)、觸覺(jué)、力覺(jué)等多模態(tài)融合。雖然不像一些初創(chuàng)公司那樣樂(lè)觀,張正友也對(duì)既定方向充滿(mǎn)信心?!肝耶?dāng)時(shí)規(guī)劃了10年的時(shí)間,現(xiàn)在7年過(guò)去了,我覺(jué)得可能再有三年會(huì)差不多,」他對(duì)未來(lái)給出了自己的時(shí)間表——讓實(shí)驗(yàn)室的技術(shù),特別是機(jī)器人的感知、規(guī)劃和行動(dòng)能力,發(fā)展到足夠成熟的水平,從而能夠支撐起像「養(yǎng)老」這樣極具挑戰(zhàn)性的、需要與人進(jìn)行安全復(fù)雜交互的場(chǎng)景應(yīng)用。至于當(dāng)前具身智能的「過(guò)熱」,在他看來(lái),反而是一件好事?!竻⑴c的人越來(lái)越多,這行業(yè)發(fā)展才會(huì)越來(lái)越快。」而騰訊的角色,就是在這一歷史進(jìn)程中,保持足夠的耐心和戰(zhàn)略定力,通過(guò)開(kāi)放自身積累七年的核心能力,為整個(gè)行業(yè)鋪好路、擰緊「螺絲」,助力所有同行者一起,更快地抵達(dá)那個(gè)「iPhone時(shí)刻」。
春閨夢(mèng)里人:原來(lái)真正的聶桑榆還活著,最后卻成全了丈夫和妹妹
摘要:《春閨夢(mèng)里人》原來(lái)真正的聶桑榆還活著,最后卻成全了丈夫和妹妹《春閨夢(mèng)里人》是由丁禹兮、彭小苒主演的古裝輕喜愛(ài)情劇,該劇講述了經(jīng)商天賦過(guò)人的少女季曼意外失憶,意外代替孿生姐姐聶桑榆進(jìn)入侯府,憑借過(guò)人的商業(yè)頭腦多次化解危機(jī),與寧鈺軒經(jīng)歷風(fēng)雨,收獲成長(zhǎng)和幸福的故事。好了言歸正傳,在最新劇情中,寧鈺軒終于查到了現(xiàn)在的 摘要:《春閨夢(mèng)里人》季曼當(dāng)初落水失憶,竟是為了救姐姐,沒(méi)想到卻是永別《春閨夢(mèng)里人》是由丁禹兮、彭小苒主演的古裝輕喜愛(ài)情劇,該劇講述了經(jīng)商天賦過(guò)人的少女季曼意外失憶,意外代替孿生姐姐聶桑榆進(jìn)入侯府,憑借過(guò)人的商業(yè)頭腦多次化解危機(jī),與寧鈺軒經(jīng)歷風(fēng)雨,收獲成長(zhǎng)和幸福的故事。好了言歸正傳,在劇中,大等會(huì)說(shuō)。《春閨夢(mèng)里人》:娶了姐姐又愛(ài)上妹妹,寧鈺軒在愛(ài)情和仇恨間抉擇