巴別魚,源自科幻小說《銀河系漫游指南》中那種能實(shí)時(shí)翻譯任何語言的神奇生物,多語言AI猶如現(xiàn)實(shí)版的巴別魚,正在打破人們之間的語言隔閡。
作為2025世界人工智能大會技術(shù)方向的議題之一,昨天在滬舉辦的“科大訊飛高級別高水平多語言基座大模型國際學(xué)術(shù)研討會”,匯聚了來自亞洲、歐洲近20個(gè)國家和地區(qū)約30位人工智能領(lǐng)域的產(chǎn)學(xué)研各界代表,10位來自中國、英國、匈牙利、塞爾維亞、以色列、伊朗、泰國、馬來西亞、柬埔寨等國的行業(yè)資深A(yù)I專家進(jìn)行了主題演講。
由于數(shù)字化語料稀缺,全球主流大模型對低資源語言的支持嚴(yán)重不足,小語種國家面臨AI邊緣化風(fēng)險(xiǎn)。如何彌合這一數(shù)字鴻溝,成為此次研討會各國專家共同關(guān)注的核心議題。
星火大模型X1可以支持130+語種
科大訊飛研究院院長劉聰介紹,最新升級的星火大模型X1可以支持130+語種,在阿語、德語、法語、韓語、日語等重點(diǎn)語種整體效果已超過GPT-4.1。通過混合語種路由等技術(shù)創(chuàng)新,星火語音大模型支持100個(gè)語種語音識別,整體效果超過WhisperV3,星火語音合成大模型支持55個(gè)語種語音合成,效果業(yè)內(nèi)領(lǐng)先。
科大訊飛研究院院長劉聰
劉聰在演講中還系統(tǒng)闡述了訊飛星火多語種多語言大模型的下一步研發(fā)計(jì)劃。他提出,未來的多語言模型將圍繞三個(gè)核心方向展開:一是推進(jìn)“語音+文本”多模態(tài)數(shù)據(jù)的共建共享,打通不同模態(tài)之間的語義壁壘;二是打造具備原生多語種語音能力的大模型底座,增強(qiáng)模型對全球語言生態(tài)的原生感知力;三是構(gòu)建融合跨語言知識遷移能力的多語言通用大模型,實(shí)現(xiàn)不同語種間的知識遷移與泛化能力提升,全面支撐全球多語言AI應(yīng)用發(fā)展。
科大訊飛智算業(yè)務(wù)部副總經(jīng)理張驍認(rèn)為,中國智算產(chǎn)業(yè)發(fā)展迅猛但面臨效率挑戰(zhàn),行業(yè)普遍存在算力迭代過快、實(shí)際可用算力不足、存量算力使用效率偏低等痛點(diǎn)。他表示可以通過構(gòu)建人工智能公共服務(wù)平臺,實(shí)現(xiàn)算力高效調(diào)度和開發(fā)者生態(tài)建設(shè),能夠讓算力資源得到有效利用,推動(dòng)智算產(chǎn)業(yè)健康發(fā)展。
讓每個(gè)人都擁有自己的“巴別魚”
英國薩里大學(xué)“以人為本的人工智能研究中心”聯(lián)合主任宋一晢教授介紹了團(tuán)隊(duì)開發(fā)的DemoFusion與NitroFusion技術(shù),能夠在一塊普通GPU上運(yùn)行超高清、實(shí)時(shí)的生成式AI模型,讓每一位創(chuàng)作者都能在本地設(shè)備上擁有“超級計(jì)算能力”。
塞爾維亞諾維薩德大學(xué)技術(shù)科學(xué)學(xué)院主任VladoDeli?教授指出,塞爾維亞語在通用模型中token占比不足0.1%,遠(yuǎn)低于斯洛文尼亞語?!罢Z言模型不能只服務(wù)大語種,每種語言都應(yīng)擁有體現(xiàn)其文化身份的大模型?!睘楸苊庠卺t(yī)療、法律等關(guān)鍵領(lǐng)域出現(xiàn)誤譯風(fēng)險(xiǎn),必須構(gòu)建符合本國語言特點(diǎn)和文化語境的國家級大模型。
面對這一系列挑戰(zhàn),國際合作成為重要解決路徑。VladoDeli?表示,希望通過與科大訊飛的合作,將本國語言技術(shù)納入全球AI生態(tài)。雙方已啟動(dòng)合作規(guī)劃,計(jì)劃將塞爾維亞語及相關(guān)南斯拉夫語言接入訊飛的翻譯設(shè)備與智能應(yīng)用系統(tǒng),并以2027年貝爾格萊德世博會為階段目標(biāo),打造本地化大模型。
訊飛星火大模型X1的語言能力已擴(kuò)展至130余種,在翻譯、推理、文本生成、數(shù)學(xué)等核心能力上已能對標(biāo)國際一流大模型,特別是在幻覺治理方面取得顯著突破,大大提升了大模型在行業(yè)應(yīng)用中的可靠性。
據(jù)介紹,科大訊飛多語種技術(shù)已為華為、比亞迪、海爾等中國企業(yè)的1.2億臺套設(shè)備提供語音交互支持,涵蓋23種語言,在非洲、東南亞等國家實(shí)地落地,為“中國智造”走出去提供語言與AI能力保障。在AI技術(shù)生態(tài)建設(shè)方面,科大訊飛已開放813項(xiàng)AI能力接口服務(wù)全球53萬開發(fā)者,其中272項(xiàng)AI能力專門面向多語種需求。
13本故事精彩刺激的高品質(zhì)小說,情節(jié)跌宕起伏,讓書友欲罷不能!
免責(zé)聲明:本文內(nèi)容由開放的智能模型自動(dòng)生成,僅供參考。