隆重介紹一下!小米!八路軍“軍糧之王”!【主播說(shuō)三農(nóng)】
本文來(lái)源:時(shí)代周報(bào)作者:何珊珊
2025世界人工智能大會(huì)(WAIC)現(xiàn)場(chǎng),人形機(jī)器人展臺(tái)空前火熱,前來(lái)觀(guān)摩者絡(luò)繹不絕。
這正折射著具身智能前所未有的話(huà)題熱度。伴隨機(jī)器人登上春晚舞臺(tái)、全球首個(gè)人形機(jī)器人馬拉松比賽舉辦,具身智能正一路成為AI領(lǐng)域最熱門(mén)的賽道之一。
在這樣的節(jié)點(diǎn),2024年12月,“訊飛系”的安徽聆動(dòng)通用機(jī)器人科技有限公司(以下簡(jiǎn)稱(chēng)為“聆動(dòng)通用”)正式成立。聆動(dòng)通用是安徽省首家“大腦-小腦-本體”全鏈路自主可控的硬科技初創(chuàng)企業(yè),同時(shí)具備多場(chǎng)景商業(yè)閉環(huán)的實(shí)踐經(jīng)驗(yàn)。依托訊飛星火認(rèn)知大模型底層能力,該公司致力于將具身大模型和通用機(jī)器人本體深度耦合,打造新型生產(chǎn)力。
在本次WAIC上,聆動(dòng)通用發(fā)布全新產(chǎn)品——具身智能采訓(xùn)推一體機(jī)。
聆動(dòng)通用CEO、科大訊飛機(jī)器人首席科學(xué)家季超對(duì)時(shí)代周報(bào)記者介紹,公司這次展出的采訓(xùn)推一體機(jī),提出了“消費(fèi)級(jí)與工規(guī)級(jí)融合方案”。聚焦行業(yè)級(jí)具身數(shù)據(jù)缺失重大問(wèn)題,應(yīng)用于具身智能機(jī)器人面向真實(shí)場(chǎng)景的技能提升訓(xùn)練,這或?qū)⑹蔷呱碇悄軝C(jī)器人從算法實(shí)驗(yàn)室走向工業(yè)產(chǎn)線(xiàn)的關(guān)鍵第一步。
在孵化聆動(dòng)通用之前,科大訊飛已有自己的機(jī)器人產(chǎn)品及相關(guān)技術(shù)布局。
2022年初,科大訊飛啟動(dòng)了“訊飛超腦2030計(jì)劃”;2023年,季超團(tuán)隊(duì)發(fā)布業(yè)界首個(gè)集成全自主國(guó)產(chǎn)認(rèn)知大模型的具身智能人形機(jī)器人,在國(guó)內(nèi)率先打通以大模型和具身智能為代表的機(jī)器人全鏈路;2024年,世界機(jī)器人大會(huì)上,科大訊飛展示了一款高約1.7米,體重為60公斤的大模型+具身智能的人形機(jī)器人,整體運(yùn)動(dòng)性能提升2倍,復(fù)雜任務(wù)拆解成功率超95%,開(kāi)放場(chǎng)景物體尋找成功率超過(guò)85%。此外,科大訊飛還推出過(guò)AI掃拖機(jī)器人X3、AI助教機(jī)器人X1等細(xì)分場(chǎng)景的機(jī)器人產(chǎn)品。
就機(jī)器人在工業(yè)場(chǎng)景中的應(yīng)用,從技術(shù)邏輯看,具身智能的核心矛盾始終存在:一方面,工業(yè)生產(chǎn)要求機(jī)器人具備近乎100%的可靠性,任何“幻覺(jué)”都可能導(dǎo)致生產(chǎn)線(xiàn)停擺;另一方面,通用大模型+機(jī)器人在實(shí)際場(chǎng)景中的規(guī)劃成功率目前還達(dá)不到工業(yè)級(jí)要求,高質(zhì)量數(shù)據(jù)的稀缺與跨場(chǎng)景適配的復(fù)雜,讓機(jī)器人難以突破“實(shí)驗(yàn)室好用、工廠(chǎng)不好用”的困境。
立足于數(shù)據(jù)缺失難題,季超與他的團(tuán)隊(duì)對(duì)采訓(xùn)推一體機(jī)的研發(fā)探索,正是試圖通過(guò)“消費(fèi)級(jí)與工規(guī)級(jí)融合”的硬件創(chuàng)新、“全棧數(shù)據(jù)鏈打通”的軟件架構(gòu),在成本與精度、通用與專(zhuān)用之間找到平衡。
在WAIC現(xiàn)場(chǎng),季超坦言,具身智能的終極戰(zhàn)場(chǎng)不在舞臺(tái),而在產(chǎn)業(yè)應(yīng)用,聆動(dòng)通用和科大訊飛要讓機(jī)器人對(duì)人類(lèi)生產(chǎn)真正產(chǎn)生幫助。
受訪(fǎng)者供圖
重塑機(jī)器人應(yīng)用:大小腦結(jié)合,探索具身智能的突圍路徑
時(shí)代周報(bào):采訓(xùn)推一體機(jī)強(qiáng)調(diào)“全棧數(shù)據(jù)鏈打通”,關(guān)鍵技術(shù)節(jié)點(diǎn)有哪些?如何與科大訊飛的核心技術(shù)(如星火大模型、語(yǔ)音交互)協(xié)同?
季超:采訓(xùn)推一體機(jī)關(guān)鍵技術(shù)節(jié)點(diǎn)包括跨不同本體的適配(例如解決構(gòu)型、協(xié)議和格式等差異)、數(shù)據(jù)清洗(高質(zhì)量的數(shù)據(jù))等。從協(xié)同來(lái)說(shuō),星火大模型是“大腦”的核心支撐,采訓(xùn)推一體機(jī)則是基于底層能力,開(kāi)發(fā)屬于自己的具身智能大模型。簡(jiǎn)而言之,聚焦機(jī)器人行業(yè)突破,是平臺(tái)+賽道的邏輯。
時(shí)代周報(bào):此次推出的采訓(xùn)推一體機(jī)為何采用消費(fèi)級(jí)與工規(guī)級(jí)融合的方案?這與行業(yè)內(nèi)其他數(shù)據(jù)采集設(shè)備有何本質(zhì)區(qū)別?
季超:采訓(xùn)推一體機(jī)核心是為了解決高質(zhì)量數(shù)據(jù)稀缺的問(wèn)題。具身智能領(lǐng)域最稀缺的是高質(zhì)量的機(jī)器人操作數(shù)據(jù),數(shù)據(jù)采集最核心的目的是為了后續(xù)的模型訓(xùn)練。
眾所周知,工業(yè)場(chǎng)景需要長(zhǎng)時(shí)間、高強(qiáng)度的數(shù)據(jù)采集,需要更加嚴(yán)苛的工規(guī)級(jí)方案,從而保證數(shù)據(jù)穩(wěn)定性,但純工規(guī)級(jí)成本太高,因此只能在關(guān)鍵環(huán)節(jié)用工規(guī)級(jí),其他部分用消費(fèi)級(jí),這樣既控制成本又能滿(mǎn)足模型訓(xùn)練需求。
我們的產(chǎn)品與其他數(shù)據(jù)采集設(shè)備的區(qū)別在于,多數(shù)設(shè)備廠(chǎng)商只賣(mài)硬件,很難負(fù)責(zé)后續(xù)數(shù)據(jù)的治理和使用。而我們推出的一體機(jī)則是“數(shù)據(jù)+服務(wù)的商業(yè)模式”,所產(chǎn)生的數(shù)據(jù)是為后端的具身大模型服務(wù)的,其采集的真機(jī)數(shù)據(jù)直接用于聆動(dòng)具身VLM基座模型的微調(diào),從而形成“數(shù)據(jù)采集—模型訓(xùn)練—硬件部署-場(chǎng)景落地”的全鏈條閉環(huán)。
時(shí)代周報(bào):當(dāng)前工業(yè)場(chǎng)景中,機(jī)器人數(shù)據(jù)采集和模型訓(xùn)練的痛點(diǎn)具體表現(xiàn)為什么?
季超:比如,在汽車(chē)零部件分揀場(chǎng)景,SKU種類(lèi)成千上萬(wàn)種,且不同品牌機(jī)器人的數(shù)據(jù)格式、接口協(xié)議也存在不統(tǒng)一的情況。小模型的開(kāi)發(fā)成本高,采集的數(shù)據(jù)現(xiàn)階段也很難互通,模型訓(xùn)練時(shí)要先花大量精力做數(shù)據(jù)質(zhì)量的校驗(yàn)和篩選轉(zhuǎn)換,效率極低。
時(shí)代周報(bào):聆動(dòng)通用的一體機(jī)方案提到“大小腦結(jié)合”是核心技術(shù)路徑,能否用通俗的語(yǔ)言解釋這一模式如何解決機(jī)器人泛化性差的問(wèn)題?
季超:“大腦”是指我們的視覺(jué)-語(yǔ)言多模態(tài)基座模型,基于互聯(lián)網(wǎng)海量數(shù)據(jù)預(yù)訓(xùn)練而成,形成針對(duì)特定任務(wù)的先驗(yàn)知識(shí),讓機(jī)器人具備一定的推理能力;“小腦”則是通過(guò)一體機(jī)采集的真機(jī)數(shù)據(jù),針對(duì)性微調(diào),讓機(jī)器人具備一定的規(guī)劃能力。
現(xiàn)階段,不同場(chǎng)景用小模型逐個(gè)開(kāi)發(fā)成本相對(duì)較高。我們的基座模型通過(guò)少量真機(jī)數(shù)據(jù)微調(diào),就能快速適配多SKU零件分揀,并在“類(lèi)”級(jí)任務(wù)之間實(shí)現(xiàn)較低成本的泛化,這得益于“大小腦結(jié)合”的范式革新。
時(shí)代周報(bào):您曾說(shuō),通用大模型的60%成功率與工業(yè)要求99.999%可靠性差距巨大。那么,如何縮小差距、解決痛點(diǎn)?
季超:差距的本質(zhì)是模型對(duì)陌生場(chǎng)景的誤判,工業(yè)場(chǎng)景天然把每一個(gè)工序的邊界盡可能壓縮,本質(zhì)上并不需要特別長(zhǎng)程的規(guī)劃,但是對(duì)節(jié)拍效率和精度有要求。因此,大腦加小腦的預(yù)訓(xùn)練加微調(diào)的方案,一定程度上可以通過(guò)提高數(shù)據(jù)質(zhì)量降低幻覺(jué)風(fēng)險(xiǎn)。
我們提出的解決方案核心價(jià)值在于“用真實(shí)數(shù)據(jù)對(duì)抗幻覺(jué)”,從而提升任務(wù)數(shù)據(jù)質(zhì)量。在硬件層面,現(xiàn)在市面上大部分的人形機(jī)器人操作精度只有厘米級(jí),但我們基本上達(dá)到毫米級(jí)。我們通過(guò)設(shè)計(jì)一體機(jī)實(shí)現(xiàn)高質(zhì)量真機(jī)數(shù)據(jù),具體到任務(wù)場(chǎng)景設(shè)計(jì),盡可能約束和定義清楚目標(biāo)場(chǎng)景任務(wù)。隨后,在預(yù)訓(xùn)練模型中實(shí)現(xiàn)海量數(shù)據(jù)預(yù)訓(xùn)練,從而形成先驗(yàn)。這樣就可以從大腦、小腦以及硬件層面,共同降低幻覺(jué)風(fēng)險(xiǎn),提升整個(gè)工業(yè)級(jí)應(yīng)用的可用性和可靠性。
時(shí)代周報(bào)記者現(xiàn)場(chǎng)攝
具身智能:機(jī)器人行業(yè)的范式革命
時(shí)代周報(bào):聆動(dòng)通用成立時(shí),具身智能硬件領(lǐng)域已有眾多玩家,為何選擇此時(shí)入局?核心競(jìng)爭(zhēng)力在哪?
季超:2021年,科大訊飛已內(nèi)部關(guān)注并開(kāi)始布局具身智能。
具身智能和大模型的發(fā)展路徑比較類(lèi)似,簡(jiǎn)單來(lái)說(shuō),就是在多模態(tài)大模型基礎(chǔ)上,進(jìn)一步進(jìn)行模態(tài)拓展。所有能被數(shù)字化的信息都可以被Tokenize,所有Token都能被Transformer擬合。具身智能接下來(lái)要走的路,就是過(guò)去幾年大模型已經(jīng)走過(guò)的路,這將是機(jī)器人行業(yè)的范式革命。
我們認(rèn)為,具身智能前景非常廣闊,足以讓各家各顯神通。
就聆動(dòng)通用而言,我們的核心競(jìng)爭(zhēng)力主要在于三點(diǎn):一是科大訊飛在大模型領(lǐng)域的豐富積累,具備切入具身領(lǐng)域的慣性?xún)?yōu)勢(shì);二是長(zhǎng)期以來(lái),團(tuán)隊(duì)沉淀的行業(yè)場(chǎng)景理解和數(shù)據(jù)積累可以快速形成數(shù)據(jù)飛輪以及到模型-應(yīng)用的閉環(huán);三是AI+供應(yīng)鏈的理解和整合能力。現(xiàn)階段,具身機(jī)器人供應(yīng)鏈雖然比較全。但是從系統(tǒng)集成角度看,距離真實(shí)行業(yè)落地還有距離,目前大多處在消費(fèi)級(jí)、科研級(jí)。
時(shí)代周報(bào):您認(rèn)為具身智能“規(guī)模化”的標(biāo)準(zhǔn)是什么?采訓(xùn)推一體機(jī)能否推動(dòng)行業(yè)邁過(guò)這道坎?
季超:規(guī)模化的標(biāo)準(zhǔn),業(yè)界各有不同理解。我們認(rèn)為,首先,整體技術(shù)范式要形成初步共識(shí),才會(huì)有規(guī)?;目赡?。目前看這兩年基本開(kāi)始收斂;再者,除了技術(shù)路線(xiàn)和技術(shù)架構(gòu)的共識(shí),規(guī)?;€需要在高質(zhì)量的數(shù)據(jù)標(biāo)準(zhǔn)上形成一致。我們推出一體機(jī)也是希望構(gòu)建未來(lái)的AI數(shù)據(jù)基建工程。
時(shí)代周報(bào):未來(lái)10~15年,采訓(xùn)推一體機(jī)這類(lèi)設(shè)備會(huì)帶來(lái)哪些新職業(yè),新業(yè)態(tài)?聆動(dòng)通用想在其中扮演什么角色?
季超:職業(yè)上,可能會(huì)催生“機(jī)器人訓(xùn)練師”這類(lèi)新職業(yè)。比如,用采訓(xùn)推一體機(jī)采集任務(wù)操作數(shù)據(jù)并訓(xùn)練技能模型,讓機(jī)器人快速掌握新技能,從而在A(yíng)I浪潮下催生的數(shù)據(jù)標(biāo)注師等職業(yè);
產(chǎn)業(yè)上,未來(lái)分工也會(huì)更細(xì),有公司做通用硬件,有公司做場(chǎng)景化模型。我們則希望在全球競(jìng)爭(zhēng)中,步入具身+高端制造業(yè)領(lǐng)域的“國(guó)家隊(duì)”序列,并憑借全棧能力重塑上下游產(chǎn)業(yè)鏈,構(gòu)建下一代具身智能機(jī)器人核心產(chǎn)業(yè)鏈,從而推動(dòng)機(jī)器人從科研、消費(fèi)層進(jìn)入工業(yè)實(shí)際生產(chǎn),滿(mǎn)足千行百業(yè)需求,構(gòu)建新一代生產(chǎn)力工具。
書(shū)評(píng):《凌天戰(zhàn)尊》《長(zhǎng)寧帝軍》《手術(shù)直播間》《龍王大人在上》
評(píng)分逆襲,《凌天戰(zhàn)尊》何以征服讀者,實(shí)力圈粉
《凌天戰(zhàn)尊》特種兵異界穿越,凌天戰(zhàn)尊歸來(lái)!「續(xù)讀」