金閔雨
當(dāng)我們讀到“蘋果”“香蕉”“西瓜”這些詞,雖然顏色不同、形狀不同、味道也不同,但仍會下意識地歸為“水果”。
哪怕是第一次見到“火龍果”這個詞,也能憑借語義線索判斷它大概也是一種水果。
這種能力被稱為語義壓縮,它讓我們能夠高效地組織知識、迅速地對世界進行分類。
那問題來了:大型語言模型(LLM)雖然語言能力驚人,但它們在語義壓縮方面能做出和人類一樣的權(quán)衡嗎?
為探討這一問題,圖靈獎得主LeCun團隊,提出了一種全新的信息論框架。
該框架通過對比人類與LLM在語義壓縮中的策略,揭示了兩者在壓縮效率與語義保真之間的根本差異:
LLM偏向極致的統(tǒng)計壓縮,而人類更重細節(jié)與語境。
語義壓縮對比框架
要實證性地研究LLM的表征方式與人類概念結(jié)構(gòu)之間的關(guān)系,需要兩個關(guān)鍵要素:
穩(wěn)健的人類概念分類基準(zhǔn)
研究團隊基于認知科學(xué)中的三項經(jīng)典研究(Rosch1973、1975和McCloskeyGlucksberg1978),構(gòu)建了一個涵蓋1049個項目、34個語義類別的統(tǒng)一基準(zhǔn)。
這些數(shù)據(jù)不僅提供了類別歸屬信息,還包含人類對各項目“典型性”的評分,反映了人類認知中概念形成的深層結(jié)構(gòu)。
相比現(xiàn)代眾包數(shù)據(jù),這些經(jīng)過專家嚴格設(shè)計的數(shù)據(jù)集更具可信度與解釋力,為LLM的類人性評估提供了高保真的比較基礎(chǔ)。
多樣化的LLM模型選擇
為全面評估不同大型語言模型在概念表征上的差異,研究團隊選取了30+LLMs(BERT、LlamA、Gemma、Qwen等),參數(shù)規(guī)模從3億到720億不等。
所有模型均從輸入嵌入層提取靜態(tài)詞元表示,以貼近人類分類實驗中“去上下文”的刺激方式,確保模型和人類的認知基準(zhǔn)保持一致,便于公平比較。
為分析LLM與人類在表達和組織語義信息時的差異,研究引入了一個信息論框架。
該框架借鑒了兩大經(jīng)典信息論原理:
速率失真理論:描述壓縮效率與信息失真之間的最優(yōu)權(quán)衡;
信息瓶頸原理:關(guān)注在壓縮表示的同時,最大程度保留與目標(biāo)相關(guān)的信息。
LLM與人類在表征策略上的關(guān)鍵差異
研究發(fā)現(xiàn),LLM的概念分類結(jié)果與人類語義分類的對齊程度顯著高于隨機水平。
這一結(jié)果驗證了LLM在語義組織方面的基本能力,并為后續(xù)更細粒度的語義結(jié)構(gòu)對比奠定了基礎(chǔ)。
但是大型語言模型真的理解細節(jié)嗎?
答案是:LLM難以處理細粒度的語義差異。它們的內(nèi)部概念結(jié)構(gòu)與人類對類別歸屬的直覺不相符。
人類典型性判斷與LLM余弦相似度之間的斯皮爾曼相關(guān)系數(shù)較弱且大多數(shù)不顯著,表明兩者在概念表征結(jié)構(gòu)上存在差異。
那LLM和人類在信息壓縮與語義保真上存在哪些關(guān)鍵差異呢?
LLM側(cè)重于統(tǒng)計壓縮,力求最大程度地減少冗余信息;而人類則更注重適應(yīng)性和豐富性,強調(diào)保持靈活性和上下文的完整性。
研究團隊
這項研究由斯坦福大學(xué)與紐約大學(xué)聯(lián)合開展,團隊成員均來自這兩所高校。
其中,第一作者為斯坦福大學(xué)博士后研究員ChenShani。
更讓網(wǎng)友震驚的的是,YannLeCun也為此研究的作者之一。
YannLeCun是當(dāng)今人工智能領(lǐng)域最具影響力的科學(xué)家之一,現(xiàn)任Meta(原Facebook)首席人工智能科學(xué)家,同時也是紐約大學(xué)教授。
LeCun早在1980年代便開始研究神經(jīng)網(wǎng)絡(luò),最著名的貢獻是提出了卷積神經(jīng)網(wǎng)絡(luò)(CNN)的核心架構(gòu)——LeNet-5,用于手寫數(shù)字識別。
該網(wǎng)絡(luò)是現(xiàn)代深度學(xué)習(xí)模型的雛形,為后續(xù)圖像識別和計算機視覺技術(shù)的發(fā)展奠定了堅實基礎(chǔ)。
他與GeoffreyHinton、YoshuaBengio被譽為“深度學(xué)習(xí)三巨頭”,共同推動了深度學(xué)習(xí)的理論與應(yīng)用突破。
2018年,三人因在深度學(xué)習(xí)領(lǐng)域的杰出貢獻,榮獲了計算機科學(xué)領(lǐng)域的最高獎項——圖靈獎。
除了技術(shù)創(chuàng)新,LeCun還積極推動深度學(xué)習(xí)技術(shù)在工業(yè)界的應(yīng)用,尤其是在Meta,領(lǐng)導(dǎo)團隊將人工智能技術(shù)應(yīng)用于大規(guī)模系統(tǒng)。
他同時是自監(jiān)督學(xué)習(xí)的積極倡導(dǎo)者,認為這是實現(xiàn)通用人工智能(AGI)的關(guān)鍵路徑之一。
可以說,LeCun的研究對人工智能技術(shù)的演進產(chǎn)生了重要影響。
論文地址:https://arxiv.org/abs/2505.17117
參考鏈接:https://x.com/ziv_ravid/status/1928118800139841760
每天學(xué)習(xí)一首古詩詞14:貫休《獻錢尚父》 一劍霜寒十四州
滿堂花醉三千客,一劍霜寒十四州。鼓角揭天嘉氣冷,風(fēng)濤動地海山秋。東南永作金天柱,誰羨當(dāng)時萬戶侯。據(jù)傳,貫休為了能夠晉見錢镠,特意創(chuàng)作了這首詩獻給他。然而,錢镠在讀到“一劍霜寒十四州”一句時,認為十四州不足以展現(xiàn)自己的雄心壯志,要求貫休將“十四州”改為“四十州”_-。對此,貫休堅決拒絕,并以“州好了吧!
十首“江湖”詩詞:滿堂花醉三千客,一劍霜寒十四州
滿堂花醉三千客,一劍霜寒十四州_?!炐荨东I錢尚父》大意:滿堂的花香熏醉了無數(shù)賓客,一把利劍橫掃兩浙十四州_|。2、砌香殘果落,汀草宿煙浮_?!炐荨堵弥袘褜O路》大意:秋夜風(fēng)急,臺階旁的果樹,落下了一層熟透的果實,清香四溢,縷縷不絕--。江霧迷漫,包圍了整個小島,那掛滿清霜的野草,在風(fēng)中搖曳是什么——。
唐朝無名詩人很霸氣的一首詩:滿堂花醉三千客,一劍霜寒十四州
因為他能詩會畫,在當(dāng)時名氣很盛————。他在詩里寫”一瓶一缽垂垂老,萬水千山得得來“,被世人稱作得得和尚。今天,就讓我們走進貫休的詩意天地,來感受他的詩歌魅力。滿堂花醉三千客,一劍霜寒十四州。花香滿樓,怎不叫人迷醉其間?賓客三千,無不為之傾倒!一把劍,寒光閃閃,鋒芒畢露,人們驚嘆他的美艷,可有誰有幫助請點贊。
來源:紅網(wǎng)
作者:許啟花
編輯:行秀妮
本文為紅辣椒評論 原創(chuàng)文章,僅系作者個人觀點,不代表紅網(wǎng)立場。轉(zhuǎn)載請附原文出處鏈接和本聲明。