7月29日消息,2025世界人工智能大會(WAIC2025)進入最后一日。
本屆WAIC期間,京東公布人工智能(AI)領域一系列新消息:言犀大模型升級為JoyAI、開源JoyAgent智能體,發(fā)布附身智能品牌JoyInside,并且宣布與數十家主流機器人品牌達成合作,包括被外界視為“AI版labubu”的Fuzozo芙崽、火火兔;教育領域的元蘿卜AI、心大陸、Folotoy、嚕咔博士;產業(yè)領域的眾擎、云深處、魔法原子等。
會后媒體群訪中,京東集團高級副總裁、京東集團探索研究院副院長何曉冬對筆者表示,他不擔心具身智能過熱,但認為具身智能的機器人距離真正落地仍需解決很多問題。
何曉冬表示,公眾對AI和具身智能的期望是很高的,很容易在一個點就引爆。但要真正走入家庭,還有很多問題要解決。例如靈巧手的控制,具備多個自由度,其實難度還不如一只人類的手。其次,大模型也尚未與機器人充分結合,例如還無法讓機器人精準定位房間內的特定物體。他認為,大家對具身智能的發(fā)展應該保持樂觀,任何產業(yè)只要走向C端用戶,就會迅速迭代成熟,智能駕駛就是類似路徑。
對于通過模型在具身智能產品商業(yè)化話題,何曉冬對筆者表示,他認為賣大模型API調用token方式是不健康的模式。這有點類似于當年“智能音箱大戰(zhàn)”,先是變成紅海,后來再壓價、產品質量就hold(保持)不住,最后整個智能音箱行業(yè)熱度慢慢消退。
“反正我還沒看到誰家靠賣tokens掙錢。最終我們是希望看到AI大模型能夠最后在一些核心的關鍵產品上產生價值,產品可以變現。這個大模型能夠產生跟別的大模型不一樣的價值,在某個特定場景產生更好的用戶體驗,這時候產品就能賣出溢價,最后這個溢價會傳導給大模型?!?/p>
何曉冬表示,大家都用好的模型,提供最好的體驗,生態(tài)才能健康。如果像智能音箱大戰(zhàn),早期進入價格戰(zhàn),大家就只能把體驗放到后面了?!?/p>
在何曉冬看來,大模型成本不是問題,而是企業(yè)要用最好的模型,提供最好的體驗,讓AI大模型在核心類別產品上產生價值,最后優(yōu)秀產品可以變現,這樣的商業(yè)落地邏輯才是健康的。
京東集團高級副總裁、京東集團探索研究院副院長何曉冬
據悉,京東在2009年自建了客服團隊,2012年開始做智能客服,成為第一家將在線機器人用到大規(guī)模電商場景中的公司。經過10余年的發(fā)展,京東AI已經拓展到包含數字人直播、智能客服、智能外呼、商家智能體等各種AI應用,并成為京東集團探索研究院的重要工作。
截至目前,京東擁有多個基座大模型,包括3B(30億)規(guī)模、10B(100億)規(guī)模、81BPro規(guī)模、81B-T1規(guī)模深度思考模型、對標GPT-4o的470B-Preview模型、性能對標R1的750B(MoE混合專家模型,激活40B)模型。
得益于京東近幾年持續(xù)加碼AI與機器人技術,截至2024年底,京東AI技術已深度應用于物流、零售場景,并成功推出了多款應用于倉儲、分揀、配送等環(huán)節(jié)的智能機器人。京東集團CEO許冉曾表示,“AI在京東整體業(yè)務中發(fā)揮越來越重要的價值?!?/p>
財報顯示,2017年-2024年,京東集團累計研發(fā)投入超過1400億元人民幣。其中,2024財年,京東集團研發(fā)支出就達到創(chuàng)紀錄的170.31億元。
年初至今,京東在“具身智能”賽道頻頻發(fā)力,引發(fā)廣泛關注,集團已成立相關業(yè)務部門和技術布局。
首先,京東探索研究院日前發(fā)布文章稱,該團隊開發(fā)了一套高擴展性的具身智能系統架構,面向雙臂靈巧手的一體式高頻率遙操技術,基于末端模仿的泛化操作方法,以及國內首個雙臂移動機器人操作的開源數據集JDManiData,全面應用于咖啡機器人等家庭場景。其中,這套具身智能系統架構突破了簡單結構化的實驗室場景局限,成功率達到80%。
其次,京東外部投資多家具身智能機器人公司,今年7月21日,千尋智能、眾擎機器人、逐際動力三家具身智能機器人公司今天同日宣布,各自新近完成一筆由京東領投的融資。
何曉冬進一步解釋了三點:一、大力投資機器人企業(yè)是因為“看好這個方向”;二、京東認為它是整個服務生態(tài)的一部分,整體生態(tài)會從中具身智能的發(fā)展上受益;第三、京東對“具身智能”概念看法比較廣,更廣泛的符合大腦、小腦加I/O(接口)的,都可以看做具身智能,而且投資會對用戶帶來很大的體驗上的提升,反過來會幫助京東增加服務生態(tài)。
“京東對具身智能的觀念是開放的,不局限在人形機器人,所有在物理世界能夠跟用戶交互、還有一定情商智商的機器人,都是京東合作的方向?!焙螘远硎?。
最后,京東已在內部成立了相關業(yè)務部門,并在今年初引入具身智能領域的多位人才,帶領多個研發(fā)團隊沿不同路線,探索具身智能的落地可行性。
今年WAIC上,京東再進一步,在具身智能之外,將大模型與機器人業(yè)務全面整合,言犀大模型升級為JoyAI,并且開源JoyAgent智能體,以及發(fā)布附身智能品牌JoyInside。
所謂“附身智能”平臺,何曉冬曾向筆者解釋稱,是指大模型Agent走向物理世界,不止包括機器人,而是包括所有機械臂、陪伴設備等能夠在物理世界與用戶交互的終端。
他認為,發(fā)展通用人工智能(AGI)有三個方向要走:第一是大語言模型;第二是多模態(tài),大模型必須具有視覺能力,未來甚至可以更進一步延伸向嗅覺、觸覺;第三是走向“附身智能(具身智能)”,包括機器人、機械臂、無人車等,讓AGI從數字世界走向物理世界。
“一方面我們很看好這個方向。另一方面,我們希望跟合作伙伴一起用最快的速度把整個這個行業(yè)發(fā)展起來。這也是為什么我們在具身智能之外,要提出‘附身智能’這個新的品牌和平臺。我們想通過‘附身智能’這種合作方式,能夠給更多的合作伙伴能力,加快整個行業(yè)的發(fā)展?!焙螘远Q。
目前,京東云正式開源JoyAgent智能體,相較通用智能體,JoyAgent依托多智能體協同引擎實現高效協作,并融合大小模型優(yōu)勢,打通AI落地“最后一公里”;同時,京東JoyInside面向廣大機器人、AI玩具、智能硬件品牌,開放附身智能招募計劃,提供完整端到端的“軟件+硬件+內容生態(tài)”一體化方案,支持SDK、盒子(即插即用模塊)、API三種靈活對接方式;此外,京東還將大力投入營銷渠道與資源,與生態(tài)合作伙伴共同打造AI爆品。
Fuzozo就是京東JoyInside合作的一款爆品AI潮玩。其背后的珞博智能的創(chuàng)始人孫兆治在交流中表示,該產品對話交互帶來的tokens消耗是驚人的,每一次交互背后是有一個相對復雜的Agent。它不是簡單一個模型,而是會調用不同模型去解決不同問題,這個機制就會調用更多token,這個成本會更高,因此賣token模式長期來看是賺不回這個錢,而是需要一個更有發(fā)展前景的合作模式,比如,Fuzozo芙崽提供每個月的會員付費訂閱模式。
何曉冬指出,京東已經在大力投入AI了,包括硬件投入、人才投入。京東探索研究院在大量招聘人才,在WAIC一方面是展示產品,另一方面也在溝通更多合作伙伴、尋求更多AI人才加入京東。
“具身智能有點像自動駕駛,早期大家有很多討論,到底是應該先做L2還是先做L3?先用模擬數據還是真實數據?最后你看,特斯拉先上L2,然后利用攝像頭開始大量收集數據。數據上來以后,技術進步這兩年是非常明顯的。所以,我估計機器人可能也會走類似路徑。”何曉冬稱。
據透露,杭州“六小龍”之一的云深處科技,即將與JoyAI合作一款ToC端機器寵物,既具有足夠高的情商和智商與用戶溝通交流,同時還有很強的行動能力,適用范圍相比過去的工業(yè)檢修場景就大了很多。
何曉冬強調,“(機器人)首先是陪伴,其次變成一個知識工具,有點類似于一個可以行走的搜索引擎。未來,我們可以把它(機器人)當成一個平臺,比如幫你取外賣。它是個行走的平臺,而且能聽懂人類的話語。這個想象空間還是非常大的?!?/p>
“有一次在京東內部的會議上,我就展示一邊溜機器狗,一邊跟它聊天。很多同事后跟我說,他們也想買一款機器狗自己溜。你可以想象,在逛公園或者在外面逛街的時候,一邊鍛煉身體一邊遛狗這樣一個場景。”何曉冬表示,現在每家都有一輛車,以后也許每家都會有一個人形機器人或者其他更多形態(tài)的機器人,讓具身智能機器人走向陪伴、服務等生活場景。
(本文首發(fā)于鈦媒體App,作者|林志佳,編輯|蓋虹達)