諾獎得主、美國科學家理查德·阿克塞爾(RichardAxel)曾表示,當前人們依舊不清楚神經(jīng)活動轉化為思維和行動的背后邏輯。他認為,洞察這一邏輯是神經(jīng)科學未來最重要的發(fā)展方向。
語言、推理和規(guī)劃等認知現(xiàn)象是神經(jīng)元和突觸活動的直接產(chǎn)物,但是目前尚無一個可以統(tǒng)領全局的理論來解釋這一過程的實現(xiàn)機制。阿克塞爾使用“邏輯”一詞似乎是在表示人們應當從日益增長的神經(jīng)科學知識中,找出足以支撐大腦功能實現(xiàn)的基本元素。
近日,美國哥倫比亞大學博士畢業(yè)生、目前在美國麻省理工學院從事博士后研究的丹尼爾·米特羅波爾斯基(DanielMitropolsky)打造了一款名為NEMO的極簡大腦神經(jīng)模型。其表示,這是首個具有生物合理性的語言學習系統(tǒng)。該系統(tǒng)能通過接觸少量與現(xiàn)實情境相關聯(lián)的句子,在不限語言的前提下習得自然語言的基本要素,包括詞匯、基礎句法及語義知識。
(來源:https://dmitropolsky.github.io/)
同時,本次系統(tǒng)可被擴展至多語言處理:只需新增一個功能區(qū)域,就能為用戶所掌握的語言配置專屬處理組件。研究人員相信這套語言習得系統(tǒng)之所以具有生物學合理性,不僅是因為其嚴格地遵循著NEMO框架,更是因為它的白板式大腦架構所包括的功能分區(qū)和連接纖維,完全可能通過哺乳動物的發(fā)育過程來實現(xiàn)自然形成。
NEMO:基于神經(jīng)科學的六個原則打造而來
據(jù)介紹,NEMO基于神經(jīng)科學中六個基礎且無爭議的原則構建了一個簡單數(shù)學表述,它們分別是:興奮性神經(jīng)元、大腦區(qū)域、隨機突觸連接、每個區(qū)域內的局部抑制、赫布可塑性和區(qū)域間抑制。NEMO模型能以極高的效率進行模擬,其模擬規(guī)模可達數(shù)千萬個神經(jīng)元和數(shù)萬億個突觸。
研究人員通過實驗發(fā)現(xiàn)NEMO符合阿克塞爾所說的那種抽象理論,并且能夠完成自然語言習得的這一動物大腦最為明顯的功能之一。與此同時,數(shù)學證明以及相關模擬也都證明,該模型能夠通過神經(jīng)集合的形成與操控來執(zhí)行基本計算,并能完成多種認知類任務比如解析自然語言句子等任務。然而,NEMO能夠這樣運行前提是:語言中的詞匯已經(jīng)由神經(jīng)集群進行了表征,并且其突觸連接已經(jīng)編碼了各個單詞的語法角色。
(來源:https://arxiv.org/pdf/2507.11788)
如前所述,研究人員通過實驗證明一個處于白板狀態(tài)的NEMO系統(tǒng)能以一種類似于人類語言習得的方式來學習一門語言的詞匯、句法和語義。具體而言,其通過接觸那些有著具體依據(jù)的語言學會了以下四種本領:第一,學會了具體名詞和動詞的語義表征;第二,學會了基本的句法特征,例如每個詞的詞性;第三,學會了多種語氣之下的語言詞序;第四,學會了生成新句子。
當然,語言習得的內涵遠不止于此。完整的語言習得描述必須涵蓋以下方面:
學會語音與音素習得(比如發(fā)音方式、音位對比);學會詞性分類(能夠掌握除了名詞、動詞外的其他詞類,比如形容詞、副詞和介詞等);功能詞(比如冠詞“the”、連詞“and”等);抽象詞匯(比如“l(fā)ove”“freedom”等表示情感或概念的詞匯);句法結構(能夠掌握超越基礎詞序的復雜句型,比如從句和倒裝句等)。
在嬰兒的大腦中,上述學習都會以微妙的方式交織在一起。然而,鑒于本次研究的目標是在嚴格控制的實驗中,驗證NEMO系統(tǒng)是否具備基礎的語言習得能力,因此他們將重點放在完成統(tǒng)計學習任務上,并分為兩個階段進行:首先讓其學習詞義與詞性,然后讓其學習詞序規(guī)則并產(chǎn)生句子生成能力。
而在語音和語音學方面,研究人員通過采用“輸入-輸出約定”來繞過了如下階段:即向系統(tǒng)呈現(xiàn)一個句子時,系統(tǒng)會將其轉化為與詞語符號對應的刺激序列,而生成句子時也是如此。
實驗中,系統(tǒng)會接觸到有依據(jù)的、由自然語言呈現(xiàn)的、與具體情境相關聯(lián)的完整句子。“有依據(jù)”的意思是,每個句子在呈現(xiàn)時,與該句子相對應的表征在感覺皮層和運動皮層中都處于激活狀態(tài)。也就是說,當輸入句子“狗在跑”時,研究人員假設運動前皮層中與“跑”相關的鏡像細胞以及下顳葉視覺皮層中通用的狗的表征都處于激活狀態(tài)。
(來源:https://arxiv.org/pdf/2507.11788)
此前有研究表明,在之前另外一種符合生物學現(xiàn)實的大腦模型中,名詞、動詞及其含義可以通過有實際依據(jù)的呈現(xiàn)方式來習得。然而,那項研究僅僅涉及到學習孤立單詞這種比較簡單的任務,并沒有涉及到句法和上下文。眾所周知,非人類靈長類動物也可以達到這種語言水平。而在本次研究之中,研究人員攻克了一個更加具有挑戰(zhàn)性的難題——即通過接觸有依據(jù)的完整句子,讓系統(tǒng)能夠習得詞匯語義、動名詞語法區(qū)分以及詞序規(guī)則。
需要說明的是,這一能力目前仍然是人類所獨有的認知特征。因此,研究人員認為他們構建出了首個在生物學上具有合理性、且能進行基本語言習得的人工模型。倘若未來人們能在非人類動物身上發(fā)現(xiàn)此類語言能力,那么研究人員相信這一發(fā)現(xiàn)將從根本上改變當前關于語言排他性的普遍觀點。
語言的生物學基礎是什么?
除了回應前文提及的阿克塞爾所說的“邏輯”之外,本次研究還涉及到另一個長期存在的根本性問題:即語言的生物學基礎是什么?
具體而言,語言是否是人類在基因、分子或神經(jīng)層面所擁有的獨特特征的產(chǎn)物?事實上,這些特征包括科學家于此前發(fā)現(xiàn)的、一度被稱為“語言基因”FOXP2基因,以及科學家最近在人類第2-3層神經(jīng)元中發(fā)現(xiàn)的新型樹突電位,這些發(fā)現(xiàn)引發(fā)了人們對于人類語言能力生物學根源的猜測。而本次研究所提出的生物合理性語言習得系統(tǒng),可被視為是另一種替代性零假設的實證:即基于簡單且廣受認可的神經(jīng)科學要素與原理,語言系統(tǒng)完全能在哺乳動物大腦的基礎上構建而來。
研究人員指出,他們所提出的特定神經(jīng)架構和算法,可被視為是一個關于人類語言系統(tǒng)的全面的、且符合神經(jīng)生物學可行性的假設,而在這一領域此前鮮有如此具體的模型。研究人員表示,本次模型所涉及的腦區(qū)(包括其數(shù)量、功能及突觸連接方式),與現(xiàn)有神經(jīng)解剖學和心理語言學的證據(jù)及觀點是互相兼容的,并在已經(jīng)具備學界共識的領域體現(xiàn)了這種一致性。與此同時,此次提出的人工語言系統(tǒng)能夠預測這些腦區(qū)在語言理解與生成過程中的激活模式,因此這一特性或將為神經(jīng)語言學研究提供重要參考。
相比目前已經(jīng)得到廣泛使用且具備語言能力的另一類計算系統(tǒng)——大模型,本次系統(tǒng)有一個重要區(qū)別:即具備生物學上的合理性。尤其是它并不依賴反向傳播這一當前機器學習領域中最為關鍵的機制,而且這種機制此前在動物大腦中從未被觀察到。
(來源:https://arxiv.org/pdf/2507.11788)
助力人類語言系統(tǒng)的進一步研究
當然,本次系統(tǒng)并未涵蓋語言的所有方面,比如語音和音系的學習被加以略過,形容詞、副詞以及功能范疇也未被納入考量。研究人員認為,通過針對現(xiàn)有系統(tǒng)進行簡單擴展,便可涵蓋許多未被涉及的方面。
研究人員表示,抽象詞匯是下一步研究的關鍵目標,這需要建立相應的表征框架,并引入新的語義處理腦區(qū)。目前,已有許多關于人類大腦如何處理抽象詞匯的認知語言學理論,這些理論可被用于指導這一領域的新研究。語言能力的其他復雜方面比如歧義消解、語法性判斷、隱喻理解及下一詞預測等,都是極具研究價值的進階挑戰(zhàn)。盡管其中部分任務可能需要針對NEMO模型進行一些符合生物機理的擴展,但是研究人員堅信這些挑戰(zhàn)均能在現(xiàn)有框架之下得到解決。
未來,研究人員的更多探索目標包括:掌握語言的社會化使用,探索語言與社會認知要素的交互機制,預計這些研究需要建立新型的表征系統(tǒng)與處理機制。此外,研究人員認為很有必要探索NEMO模型與大模型之間的交互,這有助于NEMO模型在這些更具挑戰(zhàn)性的方向上發(fā)展。除了語言能力外,各類推理形式比如邏輯推理、啟發(fā)式推理、范疇推理、概率推理等,都將成為NEMO體系面臨的重要進階挑戰(zhàn)。
盡管未來存在諸多研究方向,且依然存在一些局限性,但是研究人員此次提出的基于NEMO的基礎語言習得人工系統(tǒng)是同類系統(tǒng)中的第一個,除了能夠起到概念驗證的價值之外,該系統(tǒng)或許還能為神經(jīng)語言學研究提供幫助。由于其設計原理能在很大程度上反映當前神經(jīng)語言學的思想,因此通過生成可驗證的預測和部署更高級的版本,或將有助于指導對于人類語言系統(tǒng)的進一步研究。
參考資料:
https://arxiv.org/pdf/2507.11788
https://www.engineering.columbia.edu/faculty-staff/directory/christos-papadimitriou
https://dmitropolsky.github.io/
運營/排版:何晨龍
免責聲明:本文內容由開放的智能模型自動生成,僅供參考。