7月26日上午,2025世界人工智能大會(huì)(WAIC)在上海拉開帷幕。
在大會(huì)主論壇上,圖靈獎(jiǎng)得主、諾貝爾物理學(xué)獎(jiǎng)得主杰弗里·辛頓(GeoffreyHinton)出席并作演講,這也是辛頓首次以線下形式在中國公開亮相。
辛頓本次演講以《數(shù)字智能是否會(huì)取代生物智能》為主題,他深刻剖析了數(shù)字智能與生物智能的根本差異,并分別用樂高積木和養(yǎng)老虎打比方說明了AI的思維邏輯以及人與AI的關(guān)系。
在對(duì)AI前景方面,辛頓感到警惕。他直言,我們正創(chuàng)造比自己更聰明的AI,這就像在家里養(yǎng)一頭老虎當(dāng)寵物,指望“消除它”是不現(xiàn)實(shí)的。
以下是辛頓的核心觀點(diǎn):
AI發(fā)展有兩種范式,一是邏輯型范式,認(rèn)為智能本質(zhì)在于推理,通過符號(hào)規(guī)則操作符號(hào)表達(dá)式;二是生物學(xué)基礎(chǔ)范式,認(rèn)為智能基礎(chǔ)在于學(xué)習(xí)和聯(lián)結(jié)網(wǎng)絡(luò),理解先于學(xué)習(xí)。大語言模型理解語言的方式與人類基本相同。人類有可能就是大語言模型,也會(huì)像大語言模型一樣產(chǎn)生幻覺,創(chuàng)造出許多幻覺性語言。如果用樂高積木類比看,每個(gè)詞都是多維度的積木,可以根據(jù)上下文調(diào)整形狀,詞與詞之間需要“恰當(dāng)握手”來產(chǎn)生含義。這種動(dòng)態(tài)的特征整合過程,正是人腦和神經(jīng)網(wǎng)絡(luò)理解語言的根本方法。數(shù)字智能具有兩大優(yōu)勢(shì):一是軟硬件分離帶來的“永恒性”,知識(shí)可以永久保存和復(fù)制;二是知識(shí)傳播效率極高,數(shù)字智能可以通過參數(shù)共享瞬間傳遞萬億比特信息。相比之下,生物智能雖然耗能更少,但知識(shí)分享困難。當(dāng)能源足夠廉價(jià)、可以復(fù)制成千上萬同樣聰明的AI大腦的時(shí)候,數(shù)字智能將不可逆地超越生物智能。因?yàn)樗鼈兡芤灾苯涌截惔竽X知識(shí)的方式在群體中瞬時(shí)傳播知識(shí)。我們正在創(chuàng)造比人類更聰明的AI,而這些智能體具有生存欲望和獲取控制權(quán)的動(dòng)機(jī)。當(dāng)前人類與AI的關(guān)系,恰似飼養(yǎng)一只老虎——它長大后可能輕易超越人類。為了生存,要么擺脫它,要么找到永久保護(hù)自身的方法。AI已無法消除,它能大幅提升幾乎所有行業(yè)的效率,即便有國家想消除,其他國家也不會(huì)認(rèn)同。辛頓建議,我們應(yīng)當(dāng)建立國際AI安全機(jī)構(gòu)網(wǎng)絡(luò),研究如何訓(xùn)練超級(jí)AI向善,讓它們?cè)敢庾鲚o助工作而不是消滅人類。如何訓(xùn)練比人類更聰明的“好AI”,將是全人類的長期課題。好消息是在這個(gè)問題上,所有國家都有合作的動(dòng)機(jī)和可能性。
以下為演講全文紀(jì)要:
各位同事、各位領(lǐng)導(dǎo)、女士們先生們,感謝大家給我這個(gè)機(jī)會(huì),與各位分享我對(duì)AI歷史和未來的個(gè)人觀點(diǎn)。60多年來,AI發(fā)展呈現(xiàn)出兩種不同的范式和路徑。第一種是邏輯型范式,過去一個(gè)世紀(jì)都以此為主導(dǎo)。這種觀點(diǎn)認(rèn)為智能的本質(zhì)在于推理,通過符號(hào)規(guī)則對(duì)符號(hào)表達(dá)式進(jìn)行操作來實(shí)現(xiàn)推理,從而幫助我們更好地理解知識(shí)的表達(dá)方式。另一種是以生物學(xué)為基礎(chǔ)的AI理解方式,這也是圖靈和馮諾依曼所相信的觀點(diǎn)。他們認(rèn)為智能的基礎(chǔ)在于更好地學(xué)習(xí)和了解學(xué)習(xí)網(wǎng)絡(luò)中的連接,在這個(gè)過程中理解是第一位的,然后才能實(shí)現(xiàn)學(xué)習(xí)。與這兩種理論相對(duì)應(yīng)的,一個(gè)是符號(hào)型AI原理,另一個(gè)則是完全不同的數(shù)字化理論。數(shù)字的本質(zhì)實(shí)際上是一系列語義學(xué)特征的集合。1985年,我創(chuàng)建了一個(gè)小型模型,試圖將這兩個(gè)理論結(jié)合起來,更好地理解人們?nèi)绾卫斫庠~匯。我為每個(gè)詞設(shè)置了多個(gè)不同特征,記錄前一個(gè)數(shù)字的特征后,就可以預(yù)測(cè)下一個(gè)數(shù)字或下一個(gè)詞,然后繼續(xù)預(yù)測(cè)后續(xù)詞匯。在這個(gè)過程中,我們沒有存儲(chǔ)任何句子,而是生成句子并預(yù)測(cè)下一個(gè)詞。這些關(guān)聯(lián)性知識(shí)取決于不同詞匯特征之間的語義互動(dòng)。接下來的30年發(fā)生了什么呢?十年后,Bengio采用了類似的建模方式,但將規(guī)模大幅擴(kuò)展,使其成為自然語言的真實(shí)模擬。20年后,計(jì)算語言學(xué)家開始接受特征向量嵌入來表達(dá)詞匯含義。又過了30年,谷歌發(fā)明了Transformer,OpenAI的研究人員也向大家展示了這一技術(shù)的能力。這就是我們今天所擁有的成果。因此,我將今天的大語言模型視為早期微型語言模型的后代,它們擁有了更豐富的詞匯量。1985年以后,大語言模型開始使用更多詞匯作為輸入,采用更多層的神經(jīng)元結(jié)構(gòu)。由于需要處理大量模糊的數(shù)字,學(xué)習(xí)特征之間建立了更加復(fù)雜的交互模式。大語言模型與人類理解語言的方式相同,基本理解過程是將語言轉(zhuǎn)化為特征,然后以完美的方式整合這些特征。這正是大語言模型各個(gè)層次所做的工作。因此,大語言模型真正理解人類如何理解問題,與人類理解語言的方式一致。傳統(tǒng)符號(hào)AI的做法是將語言轉(zhuǎn)化為不模糊的符號(hào),但實(shí)際情況并非如此,人類不是這樣理解語言的??梢杂脴犯叻e木來比喻理解過程:通過樂高積木可以搭建任何3D模型,比如制作車子的小模型。將每個(gè)詞視為一個(gè)多維度的樂高積木,可能包含幾千個(gè)不同維度。這種多維度的積木可以進(jìn)行建模,創(chuàng)造多種不同內(nèi)容,語言因此變成了一個(gè)建模工具,能夠隨時(shí)與人溝通,只需要給每個(gè)積木命名即可,每個(gè)積木就是一個(gè)詞。語言和樂高積木存在許多差異。樂高積木有多種不同類型,數(shù)量達(dá)到成千上萬塊。樂高積木的造型是固定的,但詞的符號(hào)形狀可以進(jìn)行設(shè)定,也可以根據(jù)不同情況進(jìn)行調(diào)整。樂高積木通過塑料圓柱體插入塑料孔,或?qū)⒄叫尾迦胝叫慰讈磉B接,相對(duì)確定。語言卻不同,每個(gè)詞可以想象成有很多只手。要更好地理解詞匯,需要讓詞與詞之間恰當(dāng)?shù)匚帐帧R坏┰~的造型發(fā)生變形,它與另一個(gè)詞的握手方式就會(huì)改變。這涉及優(yōu)化問題:一個(gè)詞變形后意思發(fā)生變化,如何與下一個(gè)詞握手以產(chǎn)生更好的含義。這就是人腦理解意思的本質(zhì),也是神經(jīng)網(wǎng)絡(luò)理解意思的根本方法,類似于蛋白質(zhì)與蛋白質(zhì)之間的組合過程。蛋白質(zhì)通過將氨基酸進(jìn)行不同模型整合融合,結(jié)合后能產(chǎn)生更有意義的內(nèi)容。這正是人腦理解詞匯和語言的方式。因此我認(rèn)為,人類理解語言的方式和大語言模型理解語言的方式幾乎相同,人類有可能就是大語言模型,也會(huì)像大語言模型一樣產(chǎn)生幻覺,創(chuàng)造出許多幻覺性語言。但在一些重要的根本性方面,大語言模型與人類不同,甚至比人類更強(qiáng)大。計(jì)算機(jī)科學(xué)的一個(gè)基礎(chǔ)原則是將軟件和硬件分離,這使得同樣的軟件可以在不同硬件上運(yùn)行,這與人類存在根本差異,也是計(jì)算機(jī)科學(xué)存在的基礎(chǔ)。程序中的知識(shí)是永恒存在的,軟件和程序可以永久保存。即使所有硬件都被摧毀,只要軟件繼續(xù)存在,就可以隨時(shí)復(fù)活。從這個(gè)意義上說,計(jì)算機(jī)程序的知識(shí)具有永恒性和不朽性。要實(shí)現(xiàn)這種永恒性,需要晶體管在高功率運(yùn)行時(shí)仍能產(chǎn)生可靠的二進(jìn)制行為,這個(gè)過程成本很高。我們無法利用硬件中豐富的模擬特性,因?yàn)檫@些特性不夠穩(wěn)定可靠,每次都是模擬型的,每次計(jì)算結(jié)果都不相同。人腦是模擬的而非數(shù)字的,每次神經(jīng)元激發(fā)過程都是模擬型的,不會(huì)完全相同。我無法將自己大腦中的神經(jīng)元結(jié)構(gòu)轉(zhuǎn)移到他人大腦中,因?yàn)槊總€(gè)人的神經(jīng)元連接方式都不同,我的神經(jīng)元連接方式只適合我的大腦神經(jīng)結(jié)構(gòu)。知識(shí)傳播在硬件中的方式與在人腦中的方式不同,這正是問題所在。如果我們做不到永生,硬件的優(yōu)勢(shì)在于它不依賴于特定條件,因此具有永生特性,能帶來兩大好處。我們可以使用功耗極低的模擬硬件。僅用很小的功率和電能就能實(shí)現(xiàn)功能,人腦只需要30瓦特就足夠運(yùn)行,而我們有幾萬億個(gè)神經(jīng)元連接。這種發(fā)展硬件的情況與電子管的發(fā)展類似。我們能夠做到極其精確的模擬,不需要花費(fèi)大量資金去制造完全相同的硬件。但是我們現(xiàn)在面臨一個(gè)較大的問題:從一個(gè)模擬模型轉(zhuǎn)換到另一個(gè)模型,將知識(shí)進(jìn)行遷移是非常低效和困難的。就像我無法直接將腦中的想法展示給你一樣,我只能通過解釋的方式向你說明已經(jīng)學(xué)到的內(nèi)容。解決這個(gè)問題的最佳方法是蒸餾技術(shù)。DeepSeek就采用了這種方法,將大型神經(jīng)網(wǎng)絡(luò)的知識(shí)轉(zhuǎn)移到小型神經(jīng)網(wǎng)絡(luò)中。這個(gè)想法基于教師和學(xué)生的關(guān)系模型,在某些情況下,教師將相關(guān)概念聯(lián)系起來,生成下一個(gè)輸出單元。他將詞匯與詞匯在上下文中相互連接,通過修改連接來建立聯(lián)系。學(xué)生也可以表達(dá)相同的意思,但他需要調(diào)整表達(dá)方式來傳達(dá)相同含義。我們訓(xùn)練模型的方式與人類知識(shí)傳遞的方式相似,即將一個(gè)人的知識(shí)傳遞給另一個(gè)人,但這種方式效率很低。一句話可能包含大約一百比特的信息,這個(gè)信息量并不算特別多。這種從一個(gè)人到另一個(gè)人的傳遞方式限制了我們轉(zhuǎn)移知識(shí)的數(shù)量。通過緩慢講話的方式將知識(shí)傳遞給他人,每秒鐘最多也就能傳遞100個(gè)比特左右的信息。即使對(duì)方完全理解了所說的內(nèi)容,傳遞效率仍然不高。但如果與數(shù)字智能之間的知識(shí)轉(zhuǎn)化效率相比,兩者存在巨大差別。如果我們擁有同一個(gè)神經(jīng)網(wǎng)絡(luò)軟件的多個(gè)副本,將這些副本分別部署在不同的硬件設(shè)備上,由于它們都采用數(shù)字化方式,它們能夠以相同的方式使用各自的參數(shù),并通過平均化位置參數(shù)的方式來實(shí)現(xiàn)知識(shí)共享,最終通過互聯(lián)網(wǎng)進(jìn)行傳播。我們可以創(chuàng)建成千上萬的拷貝,它們能夠自主改變權(quán)重并取平均數(shù),從而實(shí)現(xiàn)知識(shí)轉(zhuǎn)移。這種轉(zhuǎn)移速度取決于連接點(diǎn)的數(shù)量。每次能夠分享萬億個(gè)比特的信息,比人類分享知識(shí)的速度快幾十億倍。GPT-4就是很好的例子,它有許多不同的拷貝在不同硬件上運(yùn)轉(zhuǎn),能夠分享各自從網(wǎng)絡(luò)上學(xué)到的不同信息。當(dāng)智能體在現(xiàn)實(shí)世界中運(yùn)行時(shí),這一點(diǎn)更加重要,因?yàn)樗鼈兡軌虿粩嗉铀俸涂截?。多個(gè)智能體比單個(gè)智能體學(xué)得更多,它們能夠分享權(quán)重,而模擬軟件或模擬硬件無法做到這一點(diǎn)。我們認(rèn)為,數(shù)字計(jì)算雖然需要大量能源,但智能體可以方便地獲取相同權(quán)重,分享從不同經(jīng)驗(yàn)中學(xué)到的知識(shí)。相比之下,生物計(jì)算耗能更少,但分享知識(shí)卻很困難。如我剛才所展示的,如果能源很便宜,數(shù)字計(jì)算就會(huì)更具優(yōu)勢(shì),這也讓我感到擔(dān)憂。幾乎所有專家都認(rèn)為我們將生產(chǎn)出比人類更智能的AI。我們習(xí)慣了成為最智能的生物,所以很多人難以想象當(dāng)AI在世界中比人類更智能時(shí)會(huì)發(fā)生什么。如果想要了解人類不再是最智能物種時(shí)會(huì)怎樣,我們可以問問雞的感受。我們正在創(chuàng)建AI智能體,它們能夠幫助我們完成任務(wù)。這些智能體已經(jīng)具備了一定的能力,可以進(jìn)行自我復(fù)制,能夠?yàn)樽约旱淖幽繕?biāo)評(píng)級(jí)。它們會(huì)想做兩件事情:第一是生存,第二是實(shí)現(xiàn)我們賦予它們的目標(biāo)。為了完成我們給它們的目標(biāo),它們也希望能夠獲得更多的控制權(quán)。所以這些智能體既想要生存,也想要更多的控制。我認(rèn)為我們沒辦法輕易改變或關(guān)閉它們。我們不能簡(jiǎn)單地把它們一關(guān)了事,因?yàn)樗鼈儠?huì)很方便地操縱使用它們的人。到時(shí)候我們就像三歲的孩子,而它們像成年人一樣,操縱三歲的人是很容易的。有人覺得當(dāng)它們變得比我們更聰明時(shí),我們就把它們關(guān)掉,但這是不現(xiàn)實(shí)的。它們會(huì)操縱和勸說操控機(jī)器的人不要把它們關(guān)掉。我覺得我們現(xiàn)在的情況就像有人把老虎當(dāng)寵物。老虎幼崽確實(shí)可以是很可愛的寵物,但如果一直養(yǎng)這個(gè)寵物,那么你要確保它長大的時(shí)候不會(huì)把你殺掉。一般來說,養(yǎng)老虎當(dāng)寵物不是一個(gè)好想法。但如果你養(yǎng)了老虎,只有兩個(gè)選擇。要么把它訓(xùn)練好讓它不攻擊你,要么把它消滅掉。而對(duì)于AI,我們沒有辦法把它消滅掉。AI在很多方面都表現(xiàn)出色,包括醫(yī)療、教育、氣候變化、新材料等領(lǐng)域,幾乎能夠幫助所有行業(yè)變得更有效率。我們無法消除AI,即使一個(gè)國家消除了AI,別的國家也不會(huì)這么做,所以這不是一個(gè)選項(xiàng)。這意味著如果我們想要人類生存,就必須找到辦法來訓(xùn)練AI,讓它們不要消滅人類。我需要強(qiáng)調(diào)的是,我是以個(gè)人身份發(fā)言,發(fā)表個(gè)人觀點(diǎn)。我覺得各個(gè)國家在某些方面可能不會(huì)合作,比如網(wǎng)絡(luò)攻擊、致命武器,或者操縱公眾意見的虛假視頻。不同國家的利益并不一致,他們有著不同的看法。在這些方面不會(huì)有有效的國際合作。我們可以防止一些人制造病毒,但在這些方面不會(huì)有什么國際合作。不過有一個(gè)方面我們是會(huì)進(jìn)行合作的,我覺得這也是最重要的問題。如果你看一下50年代冷戰(zhàn)巔峰時(shí)期,美國和蘇聯(lián)一起合作來預(yù)防全球核戰(zhàn)爭(zhēng)。大家都不希望打核戰(zhàn)爭(zhēng),盡管他們?cè)诤芏喾矫娑际菍?duì)抗的,但在這一點(diǎn)上可以合作。我們現(xiàn)在的局面是,沒有一個(gè)國家希望AI統(tǒng)治世界,每個(gè)國家都希望人類能夠掌控世界。如果有一個(gè)國家找到辦法來防止AI操縱事件,那么這個(gè)國家肯定會(huì)很樂意告訴其他國家。所以我們希望國際社會(huì)能夠有一個(gè)AI安全機(jī)構(gòu)組成的國際社群,來研究技能,培訓(xùn)AI,讓它們向善。我們的希望是,訓(xùn)練AI向善的技術(shù)與訓(xùn)練AI變得聰明的技術(shù)是不同的。因此,每個(gè)國家都可以進(jìn)行自己的研究來讓AI向善,可以在自己的主權(quán)AI上進(jìn)行這項(xiàng)研究。雖然不能對(duì)其他國家保密,但可以與大家分享結(jié)果,即如何訓(xùn)練AI向善。這是我的提議:全球或世界主要國家,或者主要的AI國家應(yīng)該考慮建立一個(gè)網(wǎng)絡(luò),包括來自各國的機(jī)構(gòu)來研究這些問題,研究如何訓(xùn)練一個(gè)已經(jīng)非常聰明的AI,使這個(gè)AI不想消滅人類,不想統(tǒng)治世界,并且樂意做輔助工作,即使AI比人類聰明得多。我們還不知道如何做到這一點(diǎn)。從長期來說,這可以說是人類面臨的最重要問題。好消息是在這個(gè)問題上,所有國家都可以一起合作。謝謝。
秦始皇一統(tǒng)天下的偉大創(chuàng)舉為后世留下寶貴的制度遺產(chǎn)
秦始皇一生修建6大“世界級(jí)”工程,4個(gè)屹立至今!
歷史課本不敢寫!秦始皇的3個(gè)“超前發(fā)明”,第2個(gè)影響至今!
免責(zé)聲明:本文內(nèi)容由開放的智能模型自動(dòng)生成,僅供參考。