巴別魚(yú),源自科幻小說(shuō)《銀河系漫游指南》中那種能實(shí)時(shí)翻譯任何語(yǔ)言的神奇生物,多語(yǔ)言AI猶如現(xiàn)實(shí)版的巴別魚(yú),正在打破人們之間的語(yǔ)言隔閡。
作為2025世界人工智能大會(huì)技術(shù)方向的議題之一,昨天在滬舉辦的“科大訊飛高級(jí)別高水平多語(yǔ)言基座大模型國(guó)際學(xué)術(shù)研討會(huì)”,匯聚了來(lái)自亞洲、歐洲近20個(gè)國(guó)家和地區(qū)約30位人工智能領(lǐng)域的產(chǎn)學(xué)研各界代表,10位來(lái)自中國(guó)、英國(guó)、匈牙利、塞爾維亞、以色列、伊朗、泰國(guó)、馬來(lái)西亞、柬埔寨等國(guó)的行業(yè)資深A(yù)I專家進(jìn)行了主題演講。
由于數(shù)字化語(yǔ)料稀缺,全球主流大模型對(duì)低資源語(yǔ)言的支持嚴(yán)重不足,小語(yǔ)種國(guó)家面臨AI邊緣化風(fēng)險(xiǎn)。如何彌合這一數(shù)字鴻溝,成為此次研討會(huì)各國(guó)專家共同關(guān)注的核心議題。
星火大模型X1可以支持130+語(yǔ)種
科大訊飛研究院院長(zhǎng)劉聰介紹,最新升級(jí)的星火大模型X1可以支持130+語(yǔ)種,在阿語(yǔ)、德語(yǔ)、法語(yǔ)、韓語(yǔ)、日語(yǔ)等重點(diǎn)語(yǔ)種整體效果已超過(guò)GPT-4.1。通過(guò)混合語(yǔ)種路由等技術(shù)創(chuàng)新,星火語(yǔ)音大模型支持100個(gè)語(yǔ)種語(yǔ)音識(shí)別,整體效果超過(guò)WhisperV3,星火語(yǔ)音合成大模型支持55個(gè)語(yǔ)種語(yǔ)音合成,效果業(yè)內(nèi)領(lǐng)先。
科大訊飛研究院院長(zhǎng)劉聰
劉聰在演講中還系統(tǒng)闡述了訊飛星火多語(yǔ)種多語(yǔ)言大模型的下一步研發(fā)計(jì)劃。他提出,未來(lái)的多語(yǔ)言模型將圍繞三個(gè)核心方向展開(kāi):一是推進(jìn)“語(yǔ)音+文本”多模態(tài)數(shù)據(jù)的共建共享,打通不同模態(tài)之間的語(yǔ)義壁壘;二是打造具備原生多語(yǔ)種語(yǔ)音能力的大模型底座,增強(qiáng)模型對(duì)全球語(yǔ)言生態(tài)的原生感知力;三是構(gòu)建融合跨語(yǔ)言知識(shí)遷移能力的多語(yǔ)言通用大模型,實(shí)現(xiàn)不同語(yǔ)種間的知識(shí)遷移與泛化能力提升,全面支撐全球多語(yǔ)言AI應(yīng)用發(fā)展。
科大訊飛智算業(yè)務(wù)部副總經(jīng)理張驍認(rèn)為,中國(guó)智算產(chǎn)業(yè)發(fā)展迅猛但面臨效率挑戰(zhàn),行業(yè)普遍存在算力迭代過(guò)快、實(shí)際可用算力不足、存量算力使用效率偏低等痛點(diǎn)。他表示可以通過(guò)構(gòu)建人工智能公共服務(wù)平臺(tái),實(shí)現(xiàn)算力高效調(diào)度和開(kāi)發(fā)者生態(tài)建設(shè),能夠讓算力資源得到有效利用,推動(dòng)智算產(chǎn)業(yè)健康發(fā)展。
讓每個(gè)人都擁有自己的“巴別魚(yú)”
英國(guó)薩里大學(xué)“以人為本的人工智能研究中心”聯(lián)合主任宋一晢教授介紹了團(tuán)隊(duì)開(kāi)發(fā)的DemoFusion與NitroFusion技術(shù),能夠在一塊普通GPU上運(yùn)行超高清、實(shí)時(shí)的生成式AI模型,讓每一位創(chuàng)作者都能在本地設(shè)備上擁有“超級(jí)計(jì)算能力”。
塞爾維亞諾維薩德大學(xué)技術(shù)科學(xué)學(xué)院主任VladoDeli?教授指出,塞爾維亞語(yǔ)在通用模型中token占比不足0.1%,遠(yuǎn)低于斯洛文尼亞語(yǔ)?!罢Z(yǔ)言模型不能只服務(wù)大語(yǔ)種,每種語(yǔ)言都應(yīng)擁有體現(xiàn)其文化身份的大模型?!睘楸苊庠卺t(yī)療、法律等關(guān)鍵領(lǐng)域出現(xiàn)誤譯風(fēng)險(xiǎn),必須構(gòu)建符合本國(guó)語(yǔ)言特點(diǎn)和文化語(yǔ)境的國(guó)家級(jí)大模型。
面對(duì)這一系列挑戰(zhàn),國(guó)際合作成為重要解決路徑。VladoDeli?表示,希望通過(guò)與科大訊飛的合作,將本國(guó)語(yǔ)言技術(shù)納入全球AI生態(tài)。雙方已啟動(dòng)合作規(guī)劃,計(jì)劃將塞爾維亞語(yǔ)及相關(guān)南斯拉夫語(yǔ)言接入訊飛的翻譯設(shè)備與智能應(yīng)用系統(tǒng),并以2027年貝爾格萊德世博會(huì)為階段目標(biāo),打造本地化大模型。
訊飛星火大模型X1的語(yǔ)言能力已擴(kuò)展至130余種,在翻譯、推理、文本生成、數(shù)學(xué)等核心能力上已能對(duì)標(biāo)國(guó)際一流大模型,特別是在幻覺(jué)治理方面取得顯著突破,大大提升了大模型在行業(yè)應(yīng)用中的可靠性。
據(jù)介紹,科大訊飛多語(yǔ)種技術(shù)已為華為、比亞迪、海爾等中國(guó)企業(yè)的1.2億臺(tái)套設(shè)備提供語(yǔ)音交互支持,涵蓋23種語(yǔ)言,在非洲、東南亞等國(guó)家實(shí)地落地,為“中國(guó)智造”走出去提供語(yǔ)言與AI能力保障。在AI技術(shù)生態(tài)建設(shè)方面,科大訊飛已開(kāi)放813項(xiàng)AI能力接口服務(wù)全球53萬(wàn)開(kāi)發(fā)者,其中272項(xiàng)AI能力專門(mén)面向多語(yǔ)種需求。
近期最火的《六年后,五個(gè)小魔王帶媽咪虐遍全球》,追到不愿放開(kāi)手!
真心安利《六年后,五個(gè)小魔王帶媽咪虐遍全球》優(yōu)質(zhì)片段熬夜吃狗糧...
六年后,五個(gè)小魔王帶媽咪歸來(lái),撕綠茶、整渣男,震懾名流圈!
免責(zé)聲明:本文內(nèi)容由開(kāi)放的智能模型自動(dòng)生成,僅供參考。