人工智能未來技術(shù)發(fā)展方向是什么?如何實(shí)現(xiàn)通用人工智能(AGI)?今天下午舉行的2025世界人工智能大會(WAIC)科學(xué)前沿全體會議上,2024年圖靈獎得主、美國阿爾伯塔大學(xué)計(jì)算機(jī)科學(xué)系教授理查德·薩頓以連線方式做了主旨演講,認(rèn)為人工智能應(yīng)從“數(shù)據(jù)時(shí)代”邁向“體驗(yàn)時(shí)代”,借鑒嬰兒學(xué)習(xí)方式,通過體驗(yàn)外部世界獲得越來越多的知識和能力,最終產(chǎn)生通用人工智能體,即具有高效的學(xué)習(xí)和泛化能力,能根據(jù)所處的復(fù)雜動態(tài)環(huán)境自主提出并完成任務(wù),且符合人類情感和倫理觀念。
薩頓與安德魯·巴托分享了2024年圖靈獎,他們是強(qiáng)化學(xué)習(xí)的奠基人。強(qiáng)化學(xué)習(xí)是一種機(jī)器學(xué)習(xí)方法,讓智能體在與環(huán)境的交互中通過試錯來學(xué)習(xí)最優(yōu)策略。智能體在環(huán)境中執(zhí)行行動,并根據(jù)行動的結(jié)果接收反饋,即獎勵。這些獎勵信號指導(dǎo)智能體調(diào)整其策略,以獲得最大化的長期累積獎勵。人類和寵物的很多學(xué)習(xí)可看作強(qiáng)化學(xué)習(xí),答對問題、成功完成任務(wù)后就能獲得獎勵。
在薩頓看來,與環(huán)境交互的強(qiáng)化學(xué)習(xí)在人工智能未來發(fā)展中,仍將扮演重要角色。近年來,雖然遵循規(guī)?;▌t(ScalingLaw)的大模型發(fā)展神速,但用于訓(xùn)練大模型的數(shù)據(jù)已幾乎耗盡,人工智能發(fā)展的“數(shù)據(jù)時(shí)代”可能會在不久的將來落幕。
2025世界人工智能大會(WAIC)科學(xué)前沿全體會議今天下午在上海舉行。
那么,下一個(gè)時(shí)代是什么呢?薩頓認(rèn)為是“體驗(yàn)時(shí)代”。他在演講中引用了人工智能奠基人艾倫·圖靈在1947年說的一句話:“我們想要的是一臺能夠從經(jīng)驗(yàn)中學(xué)習(xí)的機(jī)器?!彼^體驗(yàn),就是從經(jīng)驗(yàn)中學(xué)習(xí),這是人類的一種重要學(xué)習(xí)模式。
薩頓向與會專家展示了一段嬰兒在地上玩耍的視頻?!白⒁饪?,嬰兒是如何為自己創(chuàng)造數(shù)據(jù)的。他與玩具互動,從中學(xué)習(xí),玩膩了就會玩下一個(gè)玩具。這個(gè)過程中產(chǎn)生的數(shù)據(jù)不是靜態(tài)的,而是由嬰兒行為定制的動態(tài)數(shù)據(jù)。”他指出,這種動態(tài)數(shù)據(jù)與訓(xùn)練大模型的靜態(tài)數(shù)據(jù)集截然不同,它們由好奇心驅(qū)動的探索行為產(chǎn)生,通過眼睛、耳朵和四肢進(jìn)入學(xué)習(xí)者身體。
如何讓人工智能像嬰兒那樣,學(xué)習(xí)動態(tài)數(shù)據(jù)?一方面,要加快發(fā)展具身智能,讓擁有眼睛、耳朵和四肢的機(jī)器人與外部世界交互,獲得數(shù)據(jù)集以外的知識和能力。另一方面,要充分發(fā)揮強(qiáng)化學(xué)習(xí)的潛能,研發(fā)更好的強(qiáng)化學(xué)習(xí)算法,使智能體可以像人類那樣持續(xù)學(xué)習(xí),消除人工神經(jīng)網(wǎng)絡(luò)的“災(zāi)難性遺忘”缺陷。
在具身智能領(lǐng)域,上??蒲袌F(tuán)隊(duì)已有新的突破??茖W(xué)前沿全體會議上,上海人工智能實(shí)驗(yàn)室青年科學(xué)家龐江淼發(fā)布了“書生”具身全棧引擎(Intern-Robotics)。
上海人工智能實(shí)驗(yàn)室發(fā)布“與書生共創(chuàng)”系列成果。
通過構(gòu)建虛擬仿真建模、虛實(shí)數(shù)據(jù)貫通、訓(xùn)測一體化等技術(shù)體系,這套具身智能引擎實(shí)現(xiàn)了多項(xiàng)創(chuàng)新突破:一腦多形,開發(fā)一套模型,就能適配10余種機(jī)器人形態(tài);虛實(shí)貫通,融合真機(jī)實(shí)采與虛擬合成數(shù)據(jù),數(shù)據(jù)采集成本與前代方案相比大幅降低;訓(xùn)測一體,提供全任務(wù)工具鏈,讓用戶一鍵啟動模型訓(xùn)練,快速部署具身大腦。
上海人工智能實(shí)驗(yàn)室同步啟動了“具身智能光合計(jì)劃”,以實(shí)驗(yàn)室平臺為支撐,賦能機(jī)器人實(shí)訓(xùn)場、機(jī)器人企業(yè)和開發(fā)者社區(qū),推動數(shù)字智能向物理智能邁進(jìn)。目前,已有智元機(jī)器人、宇樹科技、銀河通用、國地共建人形機(jī)器人創(chuàng)新中心等15家企業(yè)加入這項(xiàng)計(jì)劃。
原標(biāo)題:《圖靈獎得主薩頓在WAIC演講:人工智能要向嬰兒學(xué)習(xí),邁向“體驗(yàn)時(shí)代”》
欄目主編:黃海華
來源:作者:解放日報(bào)俞陶然
免責(zé)聲明:本文內(nèi)容由開放的智能模型自動生成,僅供參考。