從大模型、Agent智能體到形形色色的AI終端產(chǎn)品,從實(shí)驗(yàn)室里的算法模型到千行百業(yè)的“生產(chǎn)力引擎”,AI技術(shù)正以前所未有的速度進(jìn)化,不斷突破人們的想象邊界。在2025世界人工智能大會(huì)展覽現(xiàn)場,我們能深刻感知到,這場全球AI領(lǐng)域的“科技奧運(yùn)會(huì)”不僅是一場創(chuàng)新秀場,更是一部濃縮的AI進(jìn)化史。展品的迭代軌跡勾勒出人工智能正從“工具”成長為重塑產(chǎn)業(yè)、賦能生活的“數(shù)字伙伴”。
抓豆腐捏雞蛋不在話下
去年,由18臺(tái)人形機(jī)器人組成的人形機(jī)器人在大會(huì)展覽現(xiàn)場陣列“迎賓”,與觀眾互動(dòng),“十八羅漢”成為大會(huì)明星。今年,人形機(jī)器人真正上崗干活,展現(xiàn)它們的“十八般武藝”。傳統(tǒng)展覽被改造為AI日常化沉浸劇場,機(jī)器人化身老上海里弄中的技能主角,在修理鋪、小賣部等場景中,完成各種精細(xì)動(dòng)作。
復(fù)旦大學(xué)可信具身智能研究院帶著團(tuán)隊(duì)研制的“自適應(yīng)視觸覺AI傳感器”首次公開亮相,搭載了傳感器的機(jī)械臂能輕松抓取果凍、嫩豆腐,并擺出各種造型?!拔覀兪怯靡曈|覺傳感技術(shù),將復(fù)雜觸覺信息轉(zhuǎn)化為高緯度視覺信息,通過AI模型的算法,讓機(jī)器人擁有媲美人類皮膚的觸覺感知能力,可以精準(zhǔn)抓取易碎易損物,完成高精度分揀與精密裝配。”
擎朗雙足服務(wù)機(jī)器人XMAN-F1是小賣部的主理人,無論是制作爆米花還是根據(jù)顧客需求調(diào)制各類冰鎮(zhèn)飲料,它都不在話下;侍酒師XMAN-R1會(huì)準(zhǔn)確識(shí)別訂單內(nèi)容,并展示精準(zhǔn)的“調(diào)酒”技藝:從識(shí)別酒瓶、精準(zhǔn)傾倒冰塊與酒水飲料等,整個(gè)過程中,模擬服務(wù)人員動(dòng)作邏輯與姿態(tài),從雙手遞物到移動(dòng)控制,融入場景需求,對應(yīng)崗位規(guī)范化流程,在擁擠的展臺(tái)環(huán)境中依然能保障穩(wěn)定移動(dòng)與安全服務(wù)。展臺(tái)工作人員介紹,XMAN系列具身服務(wù)機(jī)器人并非獨(dú)立工作,而是與其他專用機(jī)器人形成多機(jī)協(xié)作。XMAN完成服務(wù)后,擎朗配送機(jī)器人T10按最優(yōu)路徑送到顧客手中,兩者通過機(jī)器間任務(wù)調(diào)度實(shí)現(xiàn)無縫銜接。
手術(shù)機(jī)器人展現(xiàn)剝雞蛋的能力新民晚報(bào)記者陳夢澤攝
云百生公司帶來的全自主AI超顯微手術(shù)機(jī)器人,在現(xiàn)場演示“殼剝落膜不破”的精細(xì)操控能力。展臺(tái)負(fù)責(zé)人劉芳德介紹,它可執(zhí)行醫(yī)生在高倍顯微鏡下從事的精密手術(shù),精度可達(dá)微米級(jí)?!白鲆恍┛p合和切除手術(shù)時(shí),不能傷害軟組織,類似的過程就如同剝雞蛋不能破壞雞蛋里的那層膜一樣。這款機(jī)器人是在香港科技大學(xué)上海產(chǎn)教融合中心孵化的,核心的電機(jī)、傳感器、運(yùn)動(dòng)控制、視覺系統(tǒng)都是國產(chǎn)的,未來上市后價(jià)格是進(jìn)口產(chǎn)品的十分之一?,F(xiàn)在需求很旺盛,但我們還面臨著商業(yè)化的諸多挑戰(zhàn)?!?/p>
智元機(jī)器人旗下靈犀X2、精靈G1、遠(yuǎn)征A2和遠(yuǎn)征A2-W四大機(jī)器人產(chǎn)品同時(shí)亮相,綜合展示機(jī)器人的運(yùn)動(dòng)智能、作業(yè)智能和交互智能。無論是在物流場景中拆箱子,和觀眾一起玩冰壺游戲,還是引路講解、表演炫酷啦啦操,從成熟商用到開源支持二次開發(fā),智元全方位呈現(xiàn)具身智能機(jī)器人的魅力。
去年在大會(huì)上刨黃瓜皮的穹徹智能今年在大會(huì)展區(qū)開了一家“手工”冰淇淋店。穹徹智能把“想吃不想動(dòng)”寫進(jìn)程序,具身大腦驅(qū)動(dòng)雙臂機(jī)器人能夠自主打開冰柜、精準(zhǔn)挖舀冰淇淋球、均勻撒落小料、輕柔關(guān)閉冰柜,還不忘即時(shí)沖洗挖勺。穹徹與海爾聯(lián)合研發(fā)的家庭機(jī)器人也將在展會(huì)現(xiàn)場自主完成收拾衣物、洗衣、烘衣、清理地面雜物、擺放拖鞋等動(dòng)作。能夠完成這些真實(shí)生活場景中的動(dòng)作都基于具身智能創(chuàng)新技術(shù),才能讓通用機(jī)器人越來越聰明能干。
今年的世界人工智能大會(huì)集中發(fā)布3000余項(xiàng)前沿展品,展覽規(guī)模將創(chuàng)下歷史之最,其中智能機(jī)器人就包括60余款。從“蹣跚學(xué)步”到“打鼓起舞”,從早期笨拙的機(jī)械臂到如今具備“自主思考”能力的具身智能體,上海WAIC見證了機(jī)器人的飛躍成長。
將“國寶”一鍵裝進(jìn)手機(jī)
長3.85米,寬1.71米,南京博物院的寶貝《坤輿萬國全圖》是目前國內(nèi)現(xiàn)存最早、最完整、內(nèi)容最豐富的中文世界地圖。合合信息把《坤輿萬國全圖》官方文物復(fù)制件帶到大會(huì)現(xiàn)場,展示了文保數(shù)字化的最新探索。旗下掃描全能王推出了業(yè)內(nèi)首創(chuàng)的無限掃描技術(shù),觀眾通過上下、左右滑動(dòng)拍攝視頻,AI便可消除大尺寸文檔圖像拼接常見的錯(cuò)位、細(xì)節(jié)模糊、色彩失真等問題,對局部視頻進(jìn)行“智能拼圖”,將綿延的山川湖海、充滿奇思妙想的游記、趣味化的動(dòng)物“表情包”裝進(jìn)手機(jī)。當(dāng)觀眾點(diǎn)擊指定區(qū)域時(shí),還能了解400多年前的人們?nèi)绾握J(rèn)識(shí)世界,實(shí)現(xiàn)“讓文物說話,讓歷史發(fā)聲”的數(shù)字化體驗(yàn)。
無線掃描技術(shù)能把“國寶”放進(jìn)手機(jī)采訪對象供圖
據(jù)技術(shù)團(tuán)隊(duì)成員介紹,此次參展的“無限掃描”技術(shù)主要通過AI掃描,解決了大型圖片掃描或拍攝過程中存在的“清晰完整難兩全”的問題,即使拍攝過程中出現(xiàn)了輕微手抖、角度傾斜等問題,無限掃描也能夠在全局性地理解所有“碎片”的內(nèi)容和聯(lián)系后,實(shí)現(xiàn)每一塊“拼圖”的精準(zhǔn)復(fù)位。
“從識(shí)別古文到理解古文,人工智能大會(huì)一路見證了合合信息的技術(shù)躍遷。去年,我們展示了用AI古籍修復(fù)模型對敦煌遺書文字’修舊如舊‘的能力;今年展示的無線掃描黑科技,展示了如何用AI對巨型畫作進(jìn)行高清掃描和無痕拼接,可幫助多模態(tài)大模型提升大尺寸圖像全局理解力?!闭古_(tái)工作人員介紹,利用這一技術(shù),人們不僅可以輕松保存工程圖紙、大型手繪圖等,還能在旅游、逛展時(shí),高清記錄墻繪、壁畫等圖像,向身邊的朋友分享專業(yè)級(jí)畫質(zhì)作品,讓藝術(shù)傳播不受限。
陪玩伴學(xué)能力更出眾
走進(jìn)商湯科技的展臺(tái),更像是來到了“生態(tài)園”。你能感受到AI伴學(xué)新體驗(yàn)——元蘿卜全棋種對弈機(jī)器人、AI隨身學(xué)伴等各類多模態(tài)交互產(chǎn)品,打造寓教于樂的學(xué)習(xí)體驗(yàn);你能體驗(yàn)情感交互升維:全球首款寵物喂養(yǎng)AI毛絨玩具、AI養(yǎng)成潮玩等多款智能交互玩偶,實(shí)現(xiàn)多模態(tài)溫情陪伴;你也能看到具身智能的前沿突破:鈦虎、傅利葉、鹿明、帕西尼等多家機(jī)器人矩陣式亮相,嶄露未來生活新勢能。
“這款小米AI眼鏡融合商湯最新音視頻實(shí)時(shí)交互系統(tǒng),成為用戶的‘第二大腦’,不僅能幫助用戶高效處理信息、記錄生活,更在講解等場景中展現(xiàn)強(qiáng)大實(shí)力?!闭古_(tái)工作人員介紹,這只桌面萌寵機(jī)器人“小優(yōu)”集成了商湯多模態(tài)交互系統(tǒng)的實(shí)時(shí)情緒引擎與多模態(tài)連續(xù)交互能力,實(shí)現(xiàn)毫秒級(jí)表情響應(yīng)。
當(dāng)然,商湯自研的“元蘿卜”下棋機(jī)器人旁,圍滿了體驗(yàn)者——和前幾屆大會(huì)的場景如出一轍。不少觀眾對“四合一啟蒙版”尤其感興趣。據(jù)了解,這款下棋機(jī)器人集合了象棋、圍棋、五子棋、國際象棋,專為3—12歲兒童啟蒙設(shè)計(jì),并添加AI大模型,與兒童實(shí)現(xiàn)自由語音互動(dòng)。
網(wǎng)易推出了國內(nèi)首款A(yù)I原生學(xué)習(xí)硬件——有道SpaceOne答疑筆。這款展品深度融合了自研的子曰教育大模型與DeepSeek-R1推理模型雙重能力,打造了強(qiáng)大的AI答疑輔導(dǎo)效果。基于多模態(tài)視覺模型的更新,有道SpaceOne能夠“看懂、看清楚”圖形題、幾何題等復(fù)雜題型的細(xì)節(jié),并進(jìn)行推理、整合、檢查再輸出講解,而非依賴題庫對照和搬運(yùn);另一方面,多模態(tài)能力支撐AI拍照能高效識(shí)別“看圖作文”類的新型題,甚至能解決考研、考公級(jí)別的圖形邏輯難題,跨越視覺和文本之間的模態(tài)障礙,滿足學(xué)生對不同學(xué)級(jí)、不同學(xué)科的各類答疑需求。結(jié)合800萬像素的AI攝像頭,答疑筆的多模態(tài)識(shí)圖能力還進(jìn)一步拓展出豐富的視覺交互“玩法”,比如拍景點(diǎn)聽講解、拍文物學(xué)歷史等,用戶可隨拍隨問。
AI讓創(chuàng)意觸手可及
由自由量級(jí)孵化的一站式AI音樂創(chuàng)作與消費(fèi)平臺(tái)“音潮”在大會(huì)上國內(nèi)首秀,它以秒級(jí)的創(chuàng)作速度與易用性,極大程度降低了音樂制作的門檻。
一句話的靈感、一張圖片的啟發(fā)、一段隨意哼唱的曲調(diào),通過音潮就能帶來一首帶人聲演唱、充滿表現(xiàn)力的完整歌曲。依托自研音樂大模型,音潮能夠快速捕捉文字中的情緒、場景、風(fēng)格;看懂畫面中的色彩、氛圍、構(gòu)圖;聽懂哼唱中音高、節(jié)奏,自動(dòng)生成旋律、節(jié)奏、和弦等音樂元素,而完成整個(gè)創(chuàng)作的過程只需要短短一分鐘,甚至僅僅15秒就能聽到這首歌的第一個(gè)旋律。這讓即便完全沒有相關(guān)知識(shí)和技能的音樂素人,也能夠隨時(shí)、隨地、隨心創(chuàng)作歌曲,記錄當(dāng)下的感觸。
“我們的愿景,是構(gòu)建一個(gè)由AI賦能的下一代音樂生態(tài)平臺(tái)?!表?xiàng)目負(fù)責(zé)人張昆介紹,“音潮”的核心競爭力源于全鏈路自研的音樂大模型。該模型采用行業(yè)領(lǐng)先的AR+NAR架構(gòu),擁有強(qiáng)大的多模態(tài)表征能力,能夠捕捉全局動(dòng)態(tài)變化并進(jìn)行高保真重建。團(tuán)隊(duì)依托于合作的音樂領(lǐng)域?qū)<?,將底層語言模型的訓(xùn)練與專業(yè)的音樂制作過程相融入,使得音樂生成不再是一味地模仿,而是真正開展音樂創(chuàng)作。
特贊科技是一家“內(nèi)容+人工智能”的獨(dú)角獸企業(yè),希望用人工智能解決企業(yè)在內(nèi)容創(chuàng)意上的難題,它在本屆WAIC上帶來首個(gè)商業(yè)研究智能體框架atypica.AI,整合多種先進(jìn)的人工智能技術(shù),幫助企業(yè)在營銷內(nèi)容創(chuàng)作、品牌形象塑造等方面實(shí)現(xiàn)質(zhì)的飛躍。通過智能體的協(xié)作,企業(yè)可以更快速地生成符合市場需求的創(chuàng)意內(nèi)容,提升品牌傳播的效率和效果。
打工人”找到“好幫手”
在金山辦公的展臺(tái),具備多輪對話和可修改能力的AI辦公智能體,讓不少“打工人”驚呼“太需要了”!
“當(dāng)前AI已步入行業(yè)應(yīng)用關(guān)鍵階段,人工智能產(chǎn)品正從工具屬性向智能助理躍遷。”金山辦公的工作人員表示。AI辦公智能體支持文字、語音、視頻等多模態(tài)交互,用戶通過自然語言、多輪對話即可連貫完成文檔創(chuàng)作、演示文稿生成及視頻制作全流程,無須手動(dòng)操作復(fù)雜功能,即可實(shí)現(xiàn)高效人機(jī)協(xié)同,讓用戶告別熬夜趕工PPT的時(shí)代。
今年大會(huì),金山辦公還推出了“WPS電話亭”——支持自主搜索全網(wǎng)內(nèi)容,時(shí)效熱點(diǎn)資訊盡管問,不管是創(chuàng)建文檔,還是拉個(gè)表格,都能“一句話”幫用戶總結(jié)。
在商湯科技的展臺(tái),“小浣熊”同樣被好奇的“打工人”所聚焦。“辦公小浣熊是一款A(yù)I生產(chǎn)力工具產(chǎn)品,用戶通過自然語言即可完成復(fù)雜且重要的工作。”商湯科技產(chǎn)品總監(jiān)、小浣熊家族負(fù)責(zé)人賈安亞邊演示邊介紹,辦公小浣熊上線一年,已擁有數(shù)百萬個(gè)注冊用戶,為300多家企業(yè)提供了服務(wù)方案。
“我很需要一款叫‘咔皮記賬’的Agent,”從事AI研發(fā)的小唐在逛了一圈后告訴記者,“它像是為我們年輕人量身定制一樣,讓記賬和財(cái)務(wù)管理變得簡單高效?!?/p>
基礎(chǔ)算力也“可見可感”
在AI基礎(chǔ)設(shè)施明星企業(yè)無問芯穹的展區(qū),場地中央有三個(gè)摞在一起的大、中、小“盒子”,十分引人注目。工作人員介紹,無問芯穹在今年世界人工智能大會(huì)上將首次發(fā)布其全規(guī)模AI效能躍升方案,展示三大“操作系統(tǒng)級(jí)”產(chǎn)品——“無穹AI云”“無界智算平臺(tái)”與“無垠終端智能解決方案”,分別面向跨地域智算網(wǎng)絡(luò)、智算集群與多形態(tài)智能終端等全規(guī)模場景,統(tǒng)一適配多元算力,提供從模型調(diào)度、性能優(yōu)化到AI應(yīng)用部署的全鏈路支持。
展臺(tái)現(xiàn)場人頭攢動(dòng),Mootion、TripoAI、捏TA、樂玩幻鏡四家無問芯穹AI應(yīng)用生態(tài)企業(yè)大顯身手,為展臺(tái)觀眾帶來AI視頻創(chuàng)意智能體、AI語音建模、AI角色互動(dòng)、AI人像美化等豐富的人工智能互動(dòng)體驗(yàn)。
無問芯穹聯(lián)合創(chuàng)始人、CEO夏立雪表示:“大算力建設(shè)如同構(gòu)建‘巨型發(fā)電廠’,而AI應(yīng)用落地需要的是‘即插即用的插座’。當(dāng)下的人工智能算力建設(shè),需要針對性適應(yīng)小而廣泛的AI應(yīng)用企業(yè),滿足他們敏捷生產(chǎn)的算力需求。無問芯穹正持續(xù)通過自身能力,為這些豐富多彩的AI應(yīng)用企業(yè)賦能,深度支撐多樣化的人工智能場景落地,不僅助力國產(chǎn)算力以優(yōu)秀的表現(xiàn)完成任務(wù),更為產(chǎn)業(yè)鏈上下游創(chuàng)造收益,最終實(shí)現(xiàn)更恒遠(yuǎn)的價(jià)值?!?/p>
原標(biāo)題:《上海WAIC勾勒AI進(jìn)化圖譜:從“工具”到“伙伴”,千行百業(yè)閃耀AI魅力》
欄目張鈺蕓題圖來源:陳夢澤圖片來源:陳夢澤郜陽采訪對象提供
來源:作者:新民晚報(bào)葉薇郜陽易蓉
不容錯(cuò)過的《遠(yuǎn)古種田:撩漢開荒生包子》如何相愛相殺看不夠