本文來源:時代周報作者:何珊珊
2025世界人工智能大會(WAIC)現(xiàn)場,人形機(jī)器人展臺空前火熱,前來觀摩者絡(luò)繹不絕。
這正折射著具身智能前所未有的話題熱度。伴隨機(jī)器人登上春晚舞臺、全球首個人形機(jī)器人馬拉松比賽舉辦,具身智能正一路成為AI領(lǐng)域最熱門的賽道之一。
在這樣的節(jié)點,2024年12月,“訊飛系”的安徽聆動通用機(jī)器人科技有限公司(以下簡稱為“聆動通用”)正式成立。聆動通用是安徽省首家“大腦-小腦-本體”全鏈路自主可控的硬科技初創(chuàng)企業(yè),同時具備多場景商業(yè)閉環(huán)的實踐經(jīng)驗。依托訊飛星火認(rèn)知大模型底層能力,該公司致力于將具身大模型和通用機(jī)器人本體深度耦合,打造新型生產(chǎn)力。
在本次WAIC上,聆動通用發(fā)布全新產(chǎn)品——具身智能采訓(xùn)推一體機(jī)。
聆動通用CEO、科大訊飛機(jī)器人首席科學(xué)家季超對時代周報記者介紹,公司這次展出的采訓(xùn)推一體機(jī),提出了“消費級與工規(guī)級融合方案”。聚焦行業(yè)級具身數(shù)據(jù)缺失重大問題,應(yīng)用于具身智能機(jī)器人面向真實場景的技能提升訓(xùn)練,這或?qū)⑹蔷呱碇悄軝C(jī)器人從算法實驗室走向工業(yè)產(chǎn)線的關(guān)鍵第一步。
在孵化聆動通用之前,科大訊飛已有自己的機(jī)器人產(chǎn)品及相關(guān)技術(shù)布局。
2022年初,科大訊飛啟動了“訊飛超腦2030計劃”;2023年,季超團(tuán)隊發(fā)布業(yè)界首個集成全自主國產(chǎn)認(rèn)知大模型的具身智能人形機(jī)器人,在國內(nèi)率先打通以大模型和具身智能為代表的機(jī)器人全鏈路;2024年,世界機(jī)器人大會上,科大訊飛展示了一款高約1.7米,體重為60公斤的大模型+具身智能的人形機(jī)器人,整體運動性能提升2倍,復(fù)雜任務(wù)拆解成功率超95%,開放場景物體尋找成功率超過85%。此外,科大訊飛還推出過AI掃拖機(jī)器人X3、AI助教機(jī)器人X1等細(xì)分場景的機(jī)器人產(chǎn)品。
就機(jī)器人在工業(yè)場景中的應(yīng)用,從技術(shù)邏輯看,具身智能的核心矛盾始終存在:一方面,工業(yè)生產(chǎn)要求機(jī)器人具備近乎100%的可靠性,任何“幻覺”都可能導(dǎo)致生產(chǎn)線停擺;另一方面,通用大模型+機(jī)器人在實際場景中的規(guī)劃成功率目前還達(dá)不到工業(yè)級要求,高質(zhì)量數(shù)據(jù)的稀缺與跨場景適配的復(fù)雜,讓機(jī)器人難以突破“實驗室好用、工廠不好用”的困境。
立足于數(shù)據(jù)缺失難題,季超與他的團(tuán)隊對采訓(xùn)推一體機(jī)的研發(fā)探索,正是試圖通過“消費級與工規(guī)級融合”的硬件創(chuàng)新、“全棧數(shù)據(jù)鏈打通”的軟件架構(gòu),在成本與精度、通用與專用之間找到平衡。
在WAIC現(xiàn)場,季超坦言,具身智能的終極戰(zhàn)場不在舞臺,而在產(chǎn)業(yè)應(yīng)用,聆動通用和科大訊飛要讓機(jī)器人對人類生產(chǎn)真正產(chǎn)生幫助。
受訪者供圖
重塑機(jī)器人應(yīng)用:大小腦結(jié)合,探索具身智能的突圍路徑
時代周報:采訓(xùn)推一體機(jī)強調(diào)“全棧數(shù)據(jù)鏈打通”,關(guān)鍵技術(shù)節(jié)點有哪些?如何與科大訊飛的核心技術(shù)(如星火大模型、語音交互)協(xié)同?
季超:采訓(xùn)推一體機(jī)關(guān)鍵技術(shù)節(jié)點包括跨不同本體的適配(例如解決構(gòu)型、協(xié)議和格式等差異)、數(shù)據(jù)清洗(高質(zhì)量的數(shù)據(jù))等。從協(xié)同來說,星火大模型是“大腦”的核心支撐,采訓(xùn)推一體機(jī)則是基于底層能力,開發(fā)屬于自己的具身智能大模型。簡而言之,聚焦機(jī)器人行業(yè)突破,是平臺+賽道的邏輯。
時代周報:此次推出的采訓(xùn)推一體機(jī)為何采用消費級與工規(guī)級融合的方案?這與行業(yè)內(nèi)其他數(shù)據(jù)采集設(shè)備有何本質(zhì)區(qū)別?
季超:采訓(xùn)推一體機(jī)核心是為了解決高質(zhì)量數(shù)據(jù)稀缺的問題。具身智能領(lǐng)域最稀缺的是高質(zhì)量的機(jī)器人操作數(shù)據(jù),數(shù)據(jù)采集最核心的目的是為了后續(xù)的模型訓(xùn)練。
眾所周知,工業(yè)場景需要長時間、高強度的數(shù)據(jù)采集,需要更加嚴(yán)苛的工規(guī)級方案,從而保證數(shù)據(jù)穩(wěn)定性,但純工規(guī)級成本太高,因此只能在關(guān)鍵環(huán)節(jié)用工規(guī)級,其他部分用消費級,這樣既控制成本又能滿足模型訓(xùn)練需求。
我們的產(chǎn)品與其他數(shù)據(jù)采集設(shè)備的區(qū)別在于,多數(shù)設(shè)備廠商只賣硬件,很難負(fù)責(zé)后續(xù)數(shù)據(jù)的治理和使用。而我們推出的一體機(jī)則是“數(shù)據(jù)+服務(wù)的商業(yè)模式”,所產(chǎn)生的數(shù)據(jù)是為后端的具身大模型服務(wù)的,其采集的真機(jī)數(shù)據(jù)直接用于聆動具身VLM基座模型的微調(diào),從而形成“數(shù)據(jù)采集—模型訓(xùn)練—硬件部署-場景落地”的全鏈條閉環(huán)。
時代周報:當(dāng)前工業(yè)場景中,機(jī)器人數(shù)據(jù)采集和模型訓(xùn)練的痛點具體表現(xiàn)為什么?
季超:比如,在汽車零部件分揀場景,SKU種類成千上萬種,且不同品牌機(jī)器人的數(shù)據(jù)格式、接口協(xié)議也存在不統(tǒng)一的情況。小模型的開發(fā)成本高,采集的數(shù)據(jù)現(xiàn)階段也很難互通,模型訓(xùn)練時要先花大量精力做數(shù)據(jù)質(zhì)量的校驗和篩選轉(zhuǎn)換,效率極低。
時代周報:聆動通用的一體機(jī)方案提到“大小腦結(jié)合”是核心技術(shù)路徑,能否用通俗的語言解釋這一模式如何解決機(jī)器人泛化性差的問題?
季超:“大腦”是指我們的視覺-語言多模態(tài)基座模型,基于互聯(lián)網(wǎng)海量數(shù)據(jù)預(yù)訓(xùn)練而成,形成針對特定任務(wù)的先驗知識,讓機(jī)器人具備一定的推理能力;“小腦”則是通過一體機(jī)采集的真機(jī)數(shù)據(jù),針對性微調(diào),讓機(jī)器人具備一定的規(guī)劃能力。
現(xiàn)階段,不同場景用小模型逐個開發(fā)成本相對較高。我們的基座模型通過少量真機(jī)數(shù)據(jù)微調(diào),就能快速適配多SKU零件分揀,并在“類”級任務(wù)之間實現(xiàn)較低成本的泛化,這得益于“大小腦結(jié)合”的范式革新。
時代周報:您曾說,通用大模型的60%成功率與工業(yè)要求99.999%可靠性差距巨大。那么,如何縮小差距、解決痛點?
季超:差距的本質(zhì)是模型對陌生場景的誤判,工業(yè)場景天然把每一個工序的邊界盡可能壓縮,本質(zhì)上并不需要特別長程的規(guī)劃,但是對節(jié)拍效率和精度有要求。因此,大腦加小腦的預(yù)訓(xùn)練加微調(diào)的方案,一定程度上可以通過提高數(shù)據(jù)質(zhì)量降低幻覺風(fēng)險。
我們提出的解決方案核心價值在于“用真實數(shù)據(jù)對抗幻覺”,從而提升任務(wù)數(shù)據(jù)質(zhì)量。在硬件層面,現(xiàn)在市面上大部分的人形機(jī)器人操作精度只有厘米級,但我們基本上達(dá)到毫米級。我們通過設(shè)計一體機(jī)實現(xiàn)高質(zhì)量真機(jī)數(shù)據(jù),具體到任務(wù)場景設(shè)計,盡可能約束和定義清楚目標(biāo)場景任務(wù)。隨后,在預(yù)訓(xùn)練模型中實現(xiàn)海量數(shù)據(jù)預(yù)訓(xùn)練,從而形成先驗。這樣就可以從大腦、小腦以及硬件層面,共同降低幻覺風(fēng)險,提升整個工業(yè)級應(yīng)用的可用性和可靠性。
時代周報記者現(xiàn)場攝
具身智能:機(jī)器人行業(yè)的范式革命
時代周報:聆動通用成立時,具身智能硬件領(lǐng)域已有眾多玩家,為何選擇此時入局?核心競爭力在哪?
季超:2021年,科大訊飛已內(nèi)部關(guān)注并開始布局具身智能。
具身智能和大模型的發(fā)展路徑比較類似,簡單來說,就是在多模態(tài)大模型基礎(chǔ)上,進(jìn)一步進(jìn)行模態(tài)拓展。所有能被數(shù)字化的信息都可以被Tokenize,所有Token都能被Transformer擬合。具身智能接下來要走的路,就是過去幾年大模型已經(jīng)走過的路,這將是機(jī)器人行業(yè)的范式革命。
我們認(rèn)為,具身智能前景非常廣闊,足以讓各家各顯神通。
就聆動通用而言,我們的核心競爭力主要在于三點:一是科大訊飛在大模型領(lǐng)域的豐富積累,具備切入具身領(lǐng)域的慣性優(yōu)勢;二是長期以來,團(tuán)隊沉淀的行業(yè)場景理解和數(shù)據(jù)積累可以快速形成數(shù)據(jù)飛輪以及到模型-應(yīng)用的閉環(huán);三是AI+供應(yīng)鏈的理解和整合能力?,F(xiàn)階段,具身機(jī)器人供應(yīng)鏈雖然比較全。但是從系統(tǒng)集成角度看,距離真實行業(yè)落地還有距離,目前大多處在消費級、科研級。
時代周報:您認(rèn)為具身智能“規(guī)?;钡臉?biāo)準(zhǔn)是什么?采訓(xùn)推一體機(jī)能否推動行業(yè)邁過這道坎?
季超:規(guī)?;臉?biāo)準(zhǔn),業(yè)界各有不同理解。我們認(rèn)為,首先,整體技術(shù)范式要形成初步共識,才會有規(guī)?;目赡?。目前看這兩年基本開始收斂;再者,除了技術(shù)路線和技術(shù)架構(gòu)的共識,規(guī)模化還需要在高質(zhì)量的數(shù)據(jù)標(biāo)準(zhǔn)上形成一致。我們推出一體機(jī)也是希望構(gòu)建未來的AI數(shù)據(jù)基建工程。
時代周報:未來10~15年,采訓(xùn)推一體機(jī)這類設(shè)備會帶來哪些新職業(yè),新業(yè)態(tài)?聆動通用想在其中扮演什么角色?
季超:職業(yè)上,可能會催生“機(jī)器人訓(xùn)練師”這類新職業(yè)。比如,用采訓(xùn)推一體機(jī)采集任務(wù)操作數(shù)據(jù)并訓(xùn)練技能模型,讓機(jī)器人快速掌握新技能,從而在AI浪潮下催生的數(shù)據(jù)標(biāo)注師等職業(yè);
產(chǎn)業(yè)上,未來分工也會更細(xì),有公司做通用硬件,有公司做場景化模型。我們則希望在全球競爭中,步入具身+高端制造業(yè)領(lǐng)域的“國家隊”序列,并憑借全棧能力重塑上下游產(chǎn)業(yè)鏈,構(gòu)建下一代具身智能機(jī)器人核心產(chǎn)業(yè)鏈,從而推動機(jī)器人從科研、消費層進(jìn)入工業(yè)實際生產(chǎn),滿足千行百業(yè)需求,構(gòu)建新一代生產(chǎn)力工具。
九零甜妻心動藏不住免費觀看--女頻劇-控德影視
佳作摘錄:九零甜妻心動藏不住全集完整版高清在線免費觀看《九零甜妻心動藏不住》劇情簡介: 2025年由著名的導(dǎo)演內(nèi)詳拍攝的《九零甜妻心動藏不住》在大陸上映,知名演員內(nèi)詳主演的女頻劇題材電影電視劇,獲得了超高的反響和好評。控德影視影迷朋友鑒賞:在影片《九零甜妻心動藏不住》視聽創(chuàng)作方面,導(dǎo)演內(nèi)詳也有意規(guī)