7月28日上午,作為2025世界人工智能大會技術(shù)方向的重磅議題,“科大訊飛高級別高水平多語言基座大模型國際學(xué)術(shù)研討會”在滬舉辦。在全球數(shù)字化轉(zhuǎn)型深入推進的關(guān)鍵時期,研討會匯聚了來自亞洲、歐洲近20個國家和地區(qū)約30位人工智能領(lǐng)域的產(chǎn)學(xué)研各界代表,10位來自中國、英國、匈牙利、塞爾維亞、以色列、伊朗、泰國、馬來西亞、柬埔寨等國的行業(yè)資深A(yù)I專家進行了主題演講。
圍繞“共建智能語言新生態(tài),賦能全球數(shù)字文明”主題,各國專家共商推進多語言AI技術(shù)普惠發(fā)展新路徑,探索構(gòu)建更加公平包容的全球AI治理體系,以技術(shù)創(chuàng)新助力“全球南方”國家跨越數(shù)字鴻溝,充分展現(xiàn)產(chǎn)學(xué)研協(xié)同創(chuàng)新的國際合作格局。
科大訊飛研究院院長劉聰在主題演講中明確提出:“我們希望構(gòu)建全方位的多語言大模型和它的應(yīng)用,給世界提供第二種選擇?!?/p>
劉聰介紹,最新升級的星火大模型X1可以支持130+語種,在阿語、德語、法語、韓語、日語等重點語種整體效果已超過GPT-4.1。通過混合語種路由等技術(shù)創(chuàng)新,星火語音大模型支持100個語種語音識別,整體效果超過WhisperV3,星火語音合成大模型支持55個語種語音合成,效果業(yè)內(nèi)領(lǐng)先。
劉聰在演講中還系統(tǒng)闡述了訊飛星火多語種多語言大模型的下一步研發(fā)計劃。他提出,未來的多語言模型將圍繞三個核心方向展開:一是推進“語音+文本”多模態(tài)數(shù)據(jù)的共建共享,打通不同模態(tài)之間的語義壁壘;二是打造具備原生多語種語音能力的大模型底座,增強模型對全球語言生態(tài)的原生感知力;三是構(gòu)建融合跨語言知識遷移能力的多語言通用大模型,實現(xiàn)不同語種間的知識遷移與泛化能力提升,全面支撐全球多語言AI應(yīng)用發(fā)展。
科大訊飛智算業(yè)務(wù)部副總經(jīng)理張驍認為,中國智算產(chǎn)業(yè)發(fā)展迅猛但面臨效率挑戰(zhàn),行業(yè)普遍存在算力迭代過快、實際可用算力不足、存量算力使用效率偏低等痛點。針對這些挑戰(zhàn),他提出需要在“算力+算法+數(shù)據(jù)”三要素基礎(chǔ)上,引入“應(yīng)用+生態(tài)”形成五要素集合的解決思路。張驍表示,通過構(gòu)建人工智能公共服務(wù)平臺,實現(xiàn)算力高效調(diào)度和開發(fā)者生態(tài)建設(shè),能夠讓算力資源得到有效利用,推動智算產(chǎn)業(yè)健康發(fā)展。
英國薩里大學(xué)“以人為本的人工智能研究中心”聯(lián)合主任宋一晢教授認為,多語言AI猶如現(xiàn)實版的“巴別魚”——源自科幻小說《銀河系漫游指南》中那種能實時翻譯任何語言的神奇生物,正在打破人們之間的語言隔閡。
宋一晢強調(diào),人工智能的終極目標是服務(wù)人類價值、賦能每一個個體,這要求AI必須要圍繞人的體驗、創(chuàng)造力與福祉設(shè)計,同時也必須是可接觸、可控制、對所有人都有益,而不是只屬于少數(shù)人。
他表示,這意味著將AI從“云端”帶到“用戶端”,宋一晢介紹了團隊開發(fā)的DemoFusion與NitroFusion技術(shù),能夠在一塊普通GPU上運行超高清、實時的生成式AI模型,讓每一位創(chuàng)作者都能在本地設(shè)備上擁有“超級計算能力”。
宋一晢為科大訊飛及其同行用訊飛星火大模型打破語言壁壘的開創(chuàng)性工作點贊,認為這是真正意義上的以人為本,通過連接不同文化和背景的人,確保人工智能造福于每一個人??拼笥嶏w多年前已提出用人工智能建設(shè)美好世界的使命讓宋一晢印象深刻,“美好的世界是我們都想要的,在這個世界里,人工智能不是主導(dǎo)者,而是賦能者”。他表示,人工智能最終的目標是打造一種不僅“智能”,更是“直覺式、可接觸、真正屬于每一個人”的AI。
匈牙利語言學(xué)研究中心總干事GáborPrószéky教授強調(diào),數(shù)據(jù)質(zhì)量優(yōu)于數(shù)據(jù)體量,是構(gòu)建可信大語言模型的關(guān)鍵。他指出,匈牙利語作為粘著性語言,具有復(fù)雜的詞綴組合及自由語序,這為大語言模型的token劃分和長距離依賴建模帶來獨特挑戰(zhàn)。團隊開發(fā)的PULI模型家族已促成與中國AI同行的合作,通過HuGME評估框架實現(xiàn)了從訓(xùn)練、語料建設(shè)到實際應(yīng)用的完整閉環(huán)。
由于數(shù)字化語料稀缺,全球主流大模型對低資源語言的支持嚴重不足,小語種國家面臨AI邊緣化風險。如何彌合這一數(shù)字鴻溝,成為此次研討會各國專家共同關(guān)注的核心議題。
塞爾維亞諾維薩德大學(xué)技術(shù)科學(xué)學(xué)院主任VladoDeli?教授指出,塞爾維亞語在通用模型中token占比不足0.1%,遠低于斯洛文尼亞語?!罢Z言模型不能只服務(wù)大語種,每種語言都應(yīng)擁有體現(xiàn)其文化身份的大模型?!睘楸苊庠卺t(yī)療、法律等關(guān)鍵領(lǐng)域出現(xiàn)誤譯風險,必須構(gòu)建符合本國語言特點和文化語境的國家級大模型。
以色列人類語言技術(shù)協(xié)會創(chuàng)始人兼董事AvnerAlgom認為“語言服務(wù)不能只為大語種設(shè)計,小語種也應(yīng)擁有技術(shù)平權(quán)”;泰國皇家理工大學(xué)、坦亞武里皇家理工大學(xué)科學(xué)與科技學(xué)院院長NipatJongsawat強調(diào)“語言主權(quán)不是選擇,而是國家的戰(zhàn)略必要”;馬來西亞拉曼理工大學(xué)企業(yè)孵化與創(chuàng)業(yè)中心副主任YuYongPoh提出“文化理解力比參數(shù)規(guī)模更重要”;柬埔寨金邊皇家大學(xué)計算機科學(xué)系教授HengSovannarith指出:“如果語言被技術(shù)遺忘,這個群體也會被時代遺忘?!?/p>
面對這一系列挑戰(zhàn),國際合作成為重要解決路徑。塞爾維亞諾維薩德大學(xué)技術(shù)科學(xué)學(xué)院主任VladoDeli?教授還分享了與科大訊飛的合作前景,他表示,希望通過與科大訊飛的合作,將本國語言技術(shù)納入全球AI生態(tài)。雙方已啟動合作規(guī)劃,計劃將塞爾維亞語及相關(guān)南斯拉夫語言接入訊飛的翻譯設(shè)備與智能應(yīng)用系統(tǒng),并以2027年貝爾格萊德世博會為階段目標,打造本地化大模型。
此次研討會上,來自以色列的專家現(xiàn)場演講,伊朗專家通過在線方式參與學(xué)術(shù)交流,兩國專家在同一學(xué)術(shù)平臺上分享技術(shù)見解,展現(xiàn)了科技發(fā)揮著越來越重要的超越政治邊界的獨特力量。
以色列人類語言技術(shù)協(xié)會創(chuàng)始人兼董事AvnerAlgom分享了希伯來語AI技術(shù)發(fā)展經(jīng)驗。他指出,希伯來語雖是世界上唯一被成功復(fù)興為現(xiàn)代口語的古老語言,但在自然語言處理領(lǐng)域仍屬低資源語言。
Algom強調(diào),語言服務(wù)不能只為大語種設(shè)計,小語種也應(yīng)擁有技術(shù)平權(quán)。IAHLT基于開源模型,已訓(xùn)練出雙語大模型(希伯來語+英語),并部署于教育、客服、醫(yī)療等場景。通過財政激勵機制,聯(lián)合產(chǎn)業(yè)界解決數(shù)據(jù)獲取合法性、訓(xùn)練成本和落地門檻問題。
伊朗謝里夫理工大學(xué)教授HosseinAssadi在線參加了研討會,他從技術(shù)架構(gòu)角度闡述了大模型發(fā)展的存儲基礎(chǔ)設(shè)施需求。他表示,GPU能提供每秒萬億次浮點運算,但若存儲系統(tǒng)無法足夠快地流式傳輸數(shù)據(jù)或處理檢查點,強大算力就會變得無用。大型語言模型的訓(xùn)練、微調(diào)和推理過程對存儲系統(tǒng)提出嚴峻挑戰(zhàn),需要高帶寬、低延遲以及大容量的高效檢查點管理能力。當存儲系統(tǒng)出現(xiàn)瓶頸時,數(shù)千個GPU集群就會陷入等待狀態(tài),無法發(fā)揮計算優(yōu)勢。因此,存儲系統(tǒng)必須與計算能力同步擴展,才能有效支撐大規(guī)模AI模型的運行需求。
此次研討會還展現(xiàn)了中國多語言AI技術(shù)在實際應(yīng)用中的豐碩成果。隨著訊飛星火X1的全面升級,其多語言能力擴展至130余種,在翻譯、推理、文本生成、數(shù)學(xué)等核心能力上已能對標國際一流大模型,特別是在幻覺治理方面取得顯著突破,大大提升了大模型在行業(yè)應(yīng)用中的可靠性。
至今,科大訊飛多語種技術(shù)已為華為、比亞迪、海爾等中國企業(yè)的1.2億臺套設(shè)備提供語音交互支持,涵蓋23種語言,在非洲、東南亞等國家實地落地,為“中國智造”走出去提供語言與AI能力保障。在AI技術(shù)生態(tài)建設(shè)方面,科大訊飛已開放813項AI能力接口服務(wù)全球53萬開發(fā)者,其中272項AI能力專門面向多語種需求。
此次研討會的成功舉辦,充分體現(xiàn)了中國在全球AI治理中的積極作用。正如劉聰所言:多語言AI,是“一帶一路”的技術(shù)橋梁。他表示,科大訊飛將以“技術(shù)賦能+生態(tài)共建”雙輪驅(qū)動,攜手全球伙伴共建開放平臺,共享技術(shù)成果和應(yīng)用場景,用“中國智慧”助力不同文化背景的國家彌合智能鴻溝,共同構(gòu)建更加包容、更加普惠的全球人工智能生態(tài)。
通過這次研討會,各國專家達成共識:在全球化深入發(fā)展的今天,多語言大模型不僅是技術(shù)創(chuàng)新的成果,更是推動文明交流互鑒、構(gòu)建人類命運共同體的重要工具。宋一晢教授所倡導(dǎo)的構(gòu)建“人民的AI”是一項全球共同使命,需要全球協(xié)作,確保AI技術(shù)能夠服務(wù)所有社區(qū),實現(xiàn)真正意義上的技術(shù)平權(quán)和普惠發(fā)展。
中國經(jīng)驗為世界AI發(fā)展提供了寶貴的“第二種選擇”,讓每種語言——無論大小——都能擁有反映其文化身份的大語言模型,為全球數(shù)字文明的繁榮發(fā)展注入了新的動力。
延伸閱讀:與 (文化評析) 樂看暑期檔電影百:花齊?放 的相關(guān)文章