(文/劉媛媛編輯/周遠(yuǎn)方)
未來的機(jī)器人到底應(yīng)該是什么模樣?這一命題在剛剛落下帷幕的2025世界人工智能大會(huì)(WAIC)上,有了令人耳目一新的答案。
聚光燈下,一位年輕的95后科技創(chuàng)業(yè)者站在領(lǐng)獎(jiǎng)臺(tái)上。他身后的大屏幕中,名為“Emo”的人臉機(jī)器人正對(duì)著觀眾微笑。該表情并非預(yù)設(shè)程序,而是機(jī)器人通過AI預(yù)測(cè)人類情緒后,同步生成的“共情反應(yīng)”。
這位獲獎(jiǎng)?wù)?,正是抖音精選科技創(chuàng)作者“U航”(本名胡宇航)。他帶來的《人機(jī)面部協(xié)同表達(dá)》不僅斬獲WAIC青年優(yōu)秀論文獎(jiǎng)(提名獎(jiǎng)),更讓公眾看到了一種可能:當(dāng)冰冷的機(jī)械被賦予“表情靈魂”,人機(jī)交互的邊界正在被重新定義。
而更令人驚嘆的是,這項(xiàng)前沿技術(shù)的誕生,竟與抖音評(píng)論區(qū)里百萬網(wǎng)友的“腦洞”息息相關(guān)。自今年5月U航在抖音賬號(hào)首發(fā)“Emo”后,引發(fā)了不少網(wǎng)友的追更,系列視頻總播放量達(dá)到約1.5億次,每條視頻下都有網(wǎng)友認(rèn)真討論未來應(yīng)用場景,為其提供專業(yè)的建議和天馬行空的靈感。
U航習(xí)慣將關(guān)注他的百萬網(wǎng)友稱為“電子股東”,這些討論互動(dòng)也成為了他科研及創(chuàng)業(yè)路上的“天使投資”。在與觀察者網(wǎng)交流時(shí),U航表示:"通過短視頻平臺(tái),我能與潛在用戶和志同道合的朋友直接對(duì)話。那些關(guān)于情感陪伴、心理疏導(dǎo)的真實(shí)需求反饋,正切實(shí)影響著我的研發(fā)方向,讓實(shí)驗(yàn)室里的黑科技能逐步走向大眾生活。”
硬核科技青年,讓機(jī)器人不再只是“機(jī)器”
當(dāng)一臺(tái)機(jī)器人能在你微笑時(shí)同時(shí)揚(yáng)起嘴角,能在你皺眉時(shí)同步泛起眉間褶皺,它就不再是冰冷的機(jī)械,而是能感知情緒的“伙伴”。這不是科幻電影的場景,而是哥倫比亞大學(xué)博士、首形科技創(chuàng)始人U航帶著“人臉機(jī)器人Emo”交出的答卷。
U航是一位實(shí)打?qū)嵉挠埠丝萍记嗄?,他的“硬核”,刻在學(xué)術(shù)基因里。作為國家地方共建人形機(jī)器人(上海)創(chuàng)新中心特邀開發(fā)者,他的科研之路始終站在人工智能與機(jī)器人領(lǐng)域的前沿。
在哥倫比亞大學(xué)讀博期間,他的研究就瞄準(zhǔn)了一個(gè)核心命題:如何讓機(jī)器人擺脫“表情僵硬”“交互機(jī)械”的傳統(tǒng)困境。彼時(shí),學(xué)界對(duì)人臉機(jī)器人的探索常困于“恐怖谷效應(yīng)”,即越像人卻越顯詭異,根源在于機(jī)器人只會(huì)被動(dòng)模仿,無法理解“情緒為何發(fā)生”。于是U航另辟蹊徑,決心讓機(jī)器人不僅要“會(huì)做表情”,更要“懂何時(shí)做表情”。
而這個(gè)想法背后,是扎實(shí)的學(xué)術(shù)積累。其研究成果多次登上全球頂級(jí)期刊,關(guān)于機(jī)器人運(yùn)動(dòng)控制算法優(yōu)化、人工智能深度學(xué)習(xí)模型的創(chuàng)新等,得到學(xué)界高度認(rèn)可,并被《紐約時(shí)報(bào)》《NewScientist》等權(quán)威媒體聚焦。
2024年,U航正式開始創(chuàng)業(yè),探索將實(shí)驗(yàn)室的突破推向產(chǎn)業(yè)的可能性。短短數(shù)月,這個(gè)專注研發(fā)人臉機(jī)器人技術(shù)的團(tuán)隊(duì),就吸引了眾多來自全球頂尖學(xué)府的研發(fā)人才。他的目標(biāo)很明確,就是要打破傳統(tǒng)機(jī)器人“表情不自然、交互不靈活”的痛點(diǎn),讓機(jī)器真正融入人類社交。
如今Emo機(jī)器人的誕生,是U航集中研發(fā)的最新成果。這個(gè)頭部配備26個(gè)驅(qū)動(dòng)器、覆蓋柔軟硅膠皮膚的造物,藏著兩套顛覆行業(yè)的“靈魂密碼”。
第一套密碼是“預(yù)判式共情”。傳統(tǒng)機(jī)器人的表情多是“指令-動(dòng)作”的機(jī)械響應(yīng),而Emo可以通過分析人類面部的微表情,從挑眉幅度、嘴角張力等細(xì)節(jié)中,預(yù)判下一秒的情緒爆發(fā)。就像人類能從朋友的眼神里讀懂“即將大笑”,Emo能在你露出微笑前840毫秒,提前調(diào)動(dòng)面部執(zhí)行器,讓嘴角以自然的弧度上揚(yáng)。
第二套密碼是“自我建?!薄航讓Emo對(duì)著攝像頭做隨機(jī)動(dòng)作,在千萬次“自我觀察”中學(xué)習(xí)“指令與表情”的對(duì)應(yīng)關(guān)系。如同人類對(duì)著鏡子練習(xí)微笑,逐漸摸清“想笑就調(diào)動(dòng)蘋果肌,皺眉就收緊眉間肌”的肌肉記憶。這種“自主學(xué)習(xí)”能力,讓Emo的表情更為生動(dòng)。
U航告訴觀察者網(wǎng),自己想要專注研發(fā)人臉機(jī)器人,核心是看到了其中的價(jià)值?!拔艺J(rèn)為當(dāng)前人機(jī)溝通大多停留在命令式交互或工具化使用層面,但在GPT大模型等自然語言處理領(lǐng)域,人類已能與機(jī)器建立真正的情感聯(lián)結(jié),比如去年有員工稱愛上聊天AI,而豆包等交互角色模型憑借多樣的聲音、情緒,也能像虛擬伙伴般帶來情緒慰藉?!?/p>
“既然AI算法正從工具屬性向人際交流屬性轉(zhuǎn)變,終端硬件就不該只是冰冷的外殼或屏幕?!盪航表示,硬件需要更具象化,解決人和機(jī)器面對(duì)面交流的問題,讓人類未來能與AI乃至AGI實(shí)現(xiàn)面對(duì)面互動(dòng)。而未來人形機(jī)器人的一大核心價(jià)值,正是落在情緒交互上。
不難看出,在這個(gè)AI加速重塑世界的時(shí)代,U航這樣的硬核科技青年,正用技術(shù)與情感的融合,對(duì)“機(jī)器人”進(jìn)行重新定義。
與平臺(tái)共創(chuàng),讓創(chuàng)新走出封閉的實(shí)驗(yàn)室
事實(shí)上,U航的獨(dú)特之處,還在于他從不是“閉門造車”的研究者。2022年9月,他在抖音發(fā)布第一條視頻時(shí),還是網(wǎng)友眼中“在美食荒漠做中餐”的“抽象留子”。后來慢慢克服“鏡頭恐懼癥”,開始分享鉆研學(xué)術(shù)的日常,如今他的賬號(hào)已成為千萬人見證機(jī)器人進(jìn)化的“共創(chuàng)實(shí)驗(yàn)室”。
在抖音的“連載更新”里,能清晰看到其技術(shù)落地的軌跡。2024年,U航發(fā)布的“唐三藏機(jī)器人”,睜眼時(shí)面部肌肉從松弛到緊繃的細(xì)節(jié),完美復(fù)刻了“慈悲氣質(zhì)”,靈感源自網(wǎng)友“想看看傳統(tǒng)文化與AI的碰撞”的提議。
2025年7月的一條視頻里,U航在Emo的眼睛下點(diǎn)了一顆淚痣,機(jī)器人眨眼時(shí)眼尾微微下垂的瞬間,被網(wǎng)友稱為“注入靈魂”,面對(duì)“創(chuàng)造者”,Emo流露出困惑好奇的神情,像是真正有了生命。這個(gè)設(shè)計(jì)來自網(wǎng)友建議:“有瑕疵的表情才真實(shí),就像人哭的時(shí)候睫毛會(huì)濕。”
因此,U航常說:“網(wǎng)友是我的‘電子股東’,他們從‘陪讀’到‘追投’,一路見證了我的成長。”而為了給這些“電子股東”反饋,他會(huì)在每個(gè)抖音視頻下,瀏覽評(píng)論區(qū)發(fā)散性文學(xué);會(huì)定期整理網(wǎng)友評(píng)論召開“電子股東大會(huì)”,作為AI模型訓(xùn)練的“民間數(shù)據(jù)集”。
這些來自生活的智慧,讓機(jī)器人的進(jìn)化始終扎根于真實(shí)需求。助推其系列視頻總播放量達(dá)到約1.5億次,并多次登上抖音熱榜,不斷點(diǎn)燃著社區(qū)的科技互動(dòng)氛圍。
“抖音為我提供了共創(chuàng)的平臺(tái),跟網(wǎng)友互動(dòng)給了我很多靈感?!盪航向觀察者網(wǎng)透露,從內(nèi)容創(chuàng)作者到科技創(chuàng)業(yè)者,不同視角讓自己有了更大的成長。
“我覺得從研究者到科技創(chuàng)業(yè)者,再到抖音創(chuàng)作者,三者是相輔相成的,做研究能為創(chuàng)業(yè)提供技術(shù)基礎(chǔ),創(chuàng)業(yè)能為研究提供載體,再通過這個(gè)載體獲得融資、組建團(tuán)隊(duì)。而在社交平臺(tái)上發(fā)布內(nèi)容進(jìn)行宣傳,能認(rèn)識(shí)很多人,也能被有需求的人認(rèn)識(shí),還能得到不同的批評(píng)和看法,這些都能進(jìn)一步促進(jìn)研究和創(chuàng)業(yè)?!痹赨航看來,用內(nèi)容創(chuàng)作者的思維,反而能更好地理解技術(shù)的成果轉(zhuǎn)化,更好地和未來的用戶溝通。
而和U航一樣,不少新一代的科技研究者和創(chuàng)業(yè)者,在實(shí)驗(yàn)室之外,也會(huì)通過抖音記錄生活,分享成長,不斷迭代。在雙向的陪伴和互動(dòng)中,越來越多的科技研究者和創(chuàng)業(yè)者走上了更高、更專業(yè)、更廣闊的舞臺(tái),越來越多的普通網(wǎng)友推開了科技的大門。
據(jù)了解,抖音正成為越來越前沿和活躍的科技社區(qū)以及科技新星的孵化器。過去一年,科技科普類內(nèi)容播放量增長175%,每天約8400萬人在抖音觀看深度前沿科技內(nèi)容,有5成為30歲以下年輕用戶。
用戶對(duì)AI的關(guān)注也帶動(dòng)創(chuàng)作者們持續(xù)投稿,過去一年4680萬人在抖音投稿討論人工智能,產(chǎn)出2.2億條內(nèi)容。
當(dāng)科研擁抱大眾智慧,技術(shù)才能真正“活”起來。未來的創(chuàng)新,應(yīng)該屬于每一個(gè)同行者。
哈佛女博士給豪門當(dāng)家教,揭露了富人的“雞娃”悲劇:抑郁、自殺
哈佛畢業(yè)的我在豪門當(dāng)家教,窺見的“雞娃”真相震碎三觀!
哈佛畢業(yè)的我在富人區(qū)做家教,看到上流階層的雞娃真相
免責(zé)聲明:本文內(nèi)容由開放的智能模型自動(dòng)生成,僅供參考。