禰薇
巴別魚,源自科幻小說《銀河系漫游指南》中那種能實時翻譯任何語言的神奇生物,多語言AI猶如現(xiàn)實版的巴別魚,正在打破人們之間的語言隔閡。
作為2025世界人工智能大會技術方向的議題之一,昨天在滬舉辦的“科大訊飛高級別高水平多語言基座大模型國際學術研討會”,匯聚了來自亞洲、歐洲近20個國家和地區(qū)約30位人工智能領域的產(chǎn)學研各界代表,10位來自中國、英國、匈牙利、塞爾維亞、以色列、伊朗、泰國、馬來西亞、柬埔寨等國的行業(yè)資深AI專家進行了主題演講。
由于數(shù)字化語料稀缺,全球主流大模型對低資源語言的支持嚴重不足,小語種國家面臨AI邊緣化風險。如何彌合這一數(shù)字鴻溝,成為此次研討會各國專家共同關注的核心議題。
星火大模型X1可以支持130+語種
科大訊飛研究院院長劉聰介紹,最新升級的星火大模型X1可以支持130+語種,在阿語、德語、法語、韓語、日語等重點語種整體效果已超過GPT-4.1。通過混合語種路由等技術創(chuàng)新,星火語音大模型支持100個語種語音識別,整體效果超過WhisperV3,星火語音合成大模型支持55個語種語音合成,效果業(yè)內(nèi)領先。
科大訊飛研究院院長劉聰
劉聰在演講中還系統(tǒng)闡述了訊飛星火多語種多語言大模型的下一步研發(fā)計劃。他提出,未來的多語言模型將圍繞三個核心方向展開:一是推進“語音+文本”多模態(tài)數(shù)據(jù)的共建共享,打通不同模態(tài)之間的語義壁壘;二是打造具備原生多語種語音能力的大模型底座,增強模型對全球語言生態(tài)的原生感知力;三是構建融合跨語言知識遷移能力的多語言通用大模型,實現(xiàn)不同語種間的知識遷移與泛化能力提升,全面支撐全球多語言AI應用發(fā)展。
科大訊飛智算業(yè)務部副總經(jīng)理張驍認為,中國智算產(chǎn)業(yè)發(fā)展迅猛但面臨效率挑戰(zhàn),行業(yè)普遍存在算力迭代過快、實際可用算力不足、存量算力使用效率偏低等痛點。他表示可以通過構建人工智能公共服務平臺,實現(xiàn)算力高效調(diào)度和開發(fā)者生態(tài)建設,能夠讓算力資源得到有效利用,推動智算產(chǎn)業(yè)健康發(fā)展。
讓每個人都擁有自己的“巴別魚”
英國薩里大學“以人為本的人工智能研究中心”聯(lián)合主任宋一晢教授介紹了團隊開發(fā)的DemoFusion與NitroFusion技術,能夠在一塊普通GPU上運行超高清、實時的生成式AI模型,讓每一位創(chuàng)作者都能在本地設備上擁有“超級計算能力”。
塞爾維亞諾維薩德大學技術科學學院主任VladoDeli?教授指出,塞爾維亞語在通用模型中token占比不足0.1%,遠低于斯洛文尼亞語?!罢Z言模型不能只服務大語種,每種語言都應擁有體現(xiàn)其文化身份的大模型?!睘楸苊庠卺t(yī)療、法律等關鍵領域出現(xiàn)誤譯風險,必須構建符合本國語言特點和文化語境的國家級大模型。
面對這一系列挑戰(zhàn),國際合作成為重要解決路徑。VladoDeli?表示,希望通過與科大訊飛的合作,將本國語言技術納入全球AI生態(tài)。雙方已啟動合作規(guī)劃,計劃將塞爾維亞語及相關南斯拉夫語言接入訊飛的翻譯設備與智能應用系統(tǒng),并以2027年貝爾格萊德世博會為階段目標,打造本地化大模型。
訊飛星火大模型X1的語言能力已擴展至130余種,在翻譯、推理、文本生成、數(shù)學等核心能力上已能對標國際一流大模型,特別是在幻覺治理方面取得顯著突破,大大提升了大模型在行業(yè)應用中的可靠性。
據(jù)介紹,科大訊飛多語種技術已為華為、比亞迪、海爾等中國企業(yè)的1.2億臺套設備提供語音交互支持,涵蓋23種語言,在非洲、東南亞等國家實地落地,為“中國智造”走出去提供語言與AI能力保障。在AI技術生態(tài)建設方面,科大訊飛已開放813項AI能力接口服務全球53萬開發(fā)者,其中272項AI能力專門面向多語種需求。
來源:紅網(wǎng)
作者:陳雅竹
編輯:大又柔
本文為紅辣椒評論 原創(chuàng)文章,僅系作者個人觀點,不代表紅網(wǎng)立場。轉(zhuǎn)載請附原文出處鏈接和本聲明。