“巴別魚”是英國作家道格拉斯·亞當斯在1979年出版的科幻小說《銀河系漫游指南》中創(chuàng)造的虛構生物——這種外形呈黃色水蛭狀、寄生在宿主耳道內的神奇生物能夠突破語言障礙,實現跨物種的語言交流。
翻譯機的出現已經打破了人類語言的隔閡,讓人們能夠自由交流。然而進入AI時代,由于大部分的通用大模型對低資源語言的支持嚴重不足,使得小語種國家仍面臨被時代邊緣化的風險。
在今年的上海世界人工智能大會(WAIC)的一場高級別高水平多語言基座大模型國際學術研討會上,來自近20個國家的約30位語言專家和人工智能專家就如何彌合AI語言模型的鴻溝,實現普惠AI技術進行深入探討。
專家認為,如果語言被技術遺忘,那么使用這個語言的群體也會被時代遺忘;而只有當小語種國家的孩子也能夠用自己的母語向AI提問時,AI平權才真正實現了。
塞爾維亞語是流行在東歐巴爾干半島前南斯拉夫諸國的一種語言。然而,該語言的使用率遠低于同一地區(qū)的斯洛文尼亞語。塞爾維亞諾維薩德大學技術科學學院主任VladoDeli?教授指出,塞爾維亞語在通用模型中token占比不足0.1%!
“語言模型不能只服務大語種,每種語言都應擁有體現其文化身份的大模型?!盌eli?表示。他還稱,這對于人工智能在醫(yī)療、法律等關鍵領域的普及非常重要,必須構建符合本國語言特點和文化語境的國家級大模型。
匈牙利語具有極度復雜的詞綴組合及自由語序,這為大語言模型token的劃分等帶來獨特挑戰(zhàn)。對此,匈牙利語言學研究中心總干事GáborPrószéky教授強調,數據質量優(yōu)于數據體量,是構建可信大語言模型的關鍵。他希望能與中國AI同行合作,構建語言模型的評估框架,實現從訓練、語料建設到實際應用的完整閉環(huán)。
以色列人類語言技術協會(IAHLT)創(chuàng)始人兼董事AvnerAlgom以希伯來語為例稱,希伯來語雖是世界上唯一被成功復興為現代口語的古老語言,但在自然語言處理領域仍屬低資源語言。
Algom強調:“語言服務不能只為大語種設計,小語種也應擁有技術平權?!盜AHLT基于開源模型,已訓練出雙語大模型(希伯來語+英語),并部署于教育、客服、醫(yī)療等場景。通過政府財政激勵機制,聯合產業(yè)界解決數據獲取合法性、訓練成本和落地門檻問題。
科大訊飛研究院院長劉聰在研討會上表示,科大訊飛最新升級的星火大模型X1已經可以支持超過130語種,希望與來自全球的機構合作,構建全方位的多語言大模型和應用,為世界提供“中國方案”,破解全球多語言大模型技術難題。
92式步戰(zhàn)車升級大八輪!駐守東南沿海的“一等戰(zhàn)功團”百車大授裝
從報道配圖來看,此次參與授裝的是大名鼎鼎的“一等戰(zhàn)功團”。據公開資料,這是一支駐守在東南沿海地區(qū)、備戰(zhàn)在改革開放最前沿的強兵勁旅_。圖片說明:戰(zhàn)旗飄揚,血脈賡續(xù)枕戈觀瀾圖“一等戰(zhàn)功團”的戰(zhàn)旗現在隸屬于陸軍第73集團軍某合成旅,其前身是誕生于秋收起義的“紅一團”部隊,亦是人民解放軍歷史最悠久的部隊之一。作 正如其榮譽稱號所示,“一等戰(zhàn)功團”(其前身是誕生于秋收起義的“紅一團”部隊)從國內革命戰(zhàn)爭開始到抗日戰(zhàn)爭、解放戰(zhàn)爭乃至后來的對越自衛(wèi)反擊戰(zhàn),一直是表現出色,以“能打硬仗、能打勝仗”著稱_。特別是在對越自衛(wèi)反擊戰(zhàn)中,“一等戰(zhàn)功團”在攻打同登、跨越奇窮河、奪取諒山等戰(zhàn)斗中發(fā)揮了重要作用,從最初的“..炮一師五次對越作戰(zhàn)授予榮譽稱號、榮立一等功、二等功功臣名錄