齊琬
7月28日上午,作為2025世界人工智能大會(huì)技術(shù)方向的重磅議題,“科大訊飛高級(jí)別高水平多語(yǔ)言基座大模型國(guó)際學(xué)術(shù)研討會(huì)”在滬舉辦。在全球數(shù)字化轉(zhuǎn)型深入推進(jìn)的關(guān)鍵時(shí)期,研討會(huì)匯聚了來(lái)自亞洲、歐洲近20個(gè)國(guó)家和地區(qū)約30位人工智能領(lǐng)域的產(chǎn)學(xué)研各界代表,10位來(lái)自中國(guó)、英國(guó)、匈牙利、塞爾維亞、以色列、伊朗、泰國(guó)、馬來(lái)西亞、柬埔寨等國(guó)的行業(yè)資深A(yù)I專家進(jìn)行了主題演講。
圍繞“共建智能語(yǔ)言新生態(tài),賦能全球數(shù)字文明”主題,各國(guó)專家共商推進(jìn)多語(yǔ)言AI技術(shù)普惠發(fā)展新路徑,探索構(gòu)建更加公平包容的全球AI治理體系,以技術(shù)創(chuàng)新助力“全球南方”國(guó)家跨越數(shù)字鴻溝,充分展現(xiàn)產(chǎn)學(xué)研協(xié)同創(chuàng)新的國(guó)際合作格局。
科大訊飛研究院院長(zhǎng)劉聰在主題演講中明確提出:“我們希望構(gòu)建全方位的多語(yǔ)言大模型和它的應(yīng)用,給世界提供第二種選擇?!?/p>
劉聰介紹,最新升級(jí)的星火大模型X1可以支持130+語(yǔ)種,在阿語(yǔ)、德語(yǔ)、法語(yǔ)、韓語(yǔ)、日語(yǔ)等重點(diǎn)語(yǔ)種整體效果已超過GPT-4.1。通過混合語(yǔ)種路由等技術(shù)創(chuàng)新,星火語(yǔ)音大模型支持100個(gè)語(yǔ)種語(yǔ)音識(shí)別,整體效果超過WhisperV3,星火語(yǔ)音合成大模型支持55個(gè)語(yǔ)種語(yǔ)音合成,效果業(yè)內(nèi)領(lǐng)先。
劉聰在演講中還系統(tǒng)闡述了訊飛星火多語(yǔ)種多語(yǔ)言大模型的下一步研發(fā)計(jì)劃。他提出,未來(lái)的多語(yǔ)言模型將圍繞三個(gè)核心方向展開:一是推進(jìn)“語(yǔ)音+文本”多模態(tài)數(shù)據(jù)的共建共享,打通不同模態(tài)之間的語(yǔ)義壁壘;二是打造具備原生多語(yǔ)種語(yǔ)音能力的大模型底座,增強(qiáng)模型對(duì)全球語(yǔ)言生態(tài)的原生感知力;三是構(gòu)建融合跨語(yǔ)言知識(shí)遷移能力的多語(yǔ)言通用大模型,實(shí)現(xiàn)不同語(yǔ)種間的知識(shí)遷移與泛化能力提升,全面支撐全球多語(yǔ)言AI應(yīng)用發(fā)展。
科大訊飛智算業(yè)務(wù)部副總經(jīng)理張驍認(rèn)為,中國(guó)智算產(chǎn)業(yè)發(fā)展迅猛但面臨效率挑戰(zhàn),行業(yè)普遍存在算力迭代過快、實(shí)際可用算力不足、存量算力使用效率偏低等痛點(diǎn)。針對(duì)這些挑戰(zhàn),他提出需要在“算力+算法+數(shù)據(jù)”三要素基礎(chǔ)上,引入“應(yīng)用+生態(tài)”形成五要素集合的解決思路。張驍表示,通過構(gòu)建人工智能公共服務(wù)平臺(tái),實(shí)現(xiàn)算力高效調(diào)度和開發(fā)者生態(tài)建設(shè),能夠讓算力資源得到有效利用,推動(dòng)智算產(chǎn)業(yè)健康發(fā)展。
英國(guó)薩里大學(xué)“以人為本的人工智能研究中心”聯(lián)合主任宋一晢教授認(rèn)為,多語(yǔ)言AI猶如現(xiàn)實(shí)版的“巴別魚”——源自科幻小說(shuō)《銀河系漫游指南》中那種能實(shí)時(shí)翻譯任何語(yǔ)言的神奇生物,正在打破人們之間的語(yǔ)言隔閡。
宋一晢強(qiáng)調(diào),人工智能的終極目標(biāo)是服務(wù)人類價(jià)值、賦能每一個(gè)個(gè)體,這要求AI必須要圍繞人的體驗(yàn)、創(chuàng)造力與福祉設(shè)計(jì),同時(shí)也必須是可接觸、可控制、對(duì)所有人都有益,而不是只屬于少數(shù)人。
他表示,這意味著將AI從“云端”帶到“用戶端”,宋一晢介紹了團(tuán)隊(duì)開發(fā)的DemoFusion與NitroFusion技術(shù),能夠在一塊普通GPU上運(yùn)行超高清、實(shí)時(shí)的生成式AI模型,讓每一位創(chuàng)作者都能在本地設(shè)備上擁有“超級(jí)計(jì)算能力”。
宋一晢為科大訊飛及其同行用訊飛星火大模型打破語(yǔ)言壁壘的開創(chuàng)性工作點(diǎn)贊,認(rèn)為這是真正意義上的以人為本,通過連接不同文化和背景的人,確保人工智能造福于每一個(gè)人。科大訊飛多年前已提出用人工智能建設(shè)美好世界的使命讓宋一晢印象深刻,“美好的世界是我們都想要的,在這個(gè)世界里,人工智能不是主導(dǎo)者,而是賦能者”。他表示,人工智能最終的目標(biāo)是打造一種不僅“智能”,更是“直覺式、可接觸、真正屬于每一個(gè)人”的AI。
匈牙利語(yǔ)言學(xué)研究中心總干事GáborPrószéky教授強(qiáng)調(diào),數(shù)據(jù)質(zhì)量?jī)?yōu)于數(shù)據(jù)體量,是構(gòu)建可信大語(yǔ)言模型的關(guān)鍵。他指出,匈牙利語(yǔ)作為粘著性語(yǔ)言,具有復(fù)雜的詞綴組合及自由語(yǔ)序,這為大語(yǔ)言模型的token劃分和長(zhǎng)距離依賴建模帶來(lái)獨(dú)特挑戰(zhàn)。團(tuán)隊(duì)開發(fā)的PULI模型家族已促成與中國(guó)AI同行的合作,通過HuGME評(píng)估框架實(shí)現(xiàn)了從訓(xùn)練、語(yǔ)料建設(shè)到實(shí)際應(yīng)用的完整閉環(huán)。
由于數(shù)字化語(yǔ)料稀缺,全球主流大模型對(duì)低資源語(yǔ)言的支持嚴(yán)重不足,小語(yǔ)種國(guó)家面臨AI邊緣化風(fēng)險(xiǎn)。如何彌合這一數(shù)字鴻溝,成為此次研討會(huì)各國(guó)專家共同關(guān)注的核心議題。
塞爾維亞諾維薩德大學(xué)技術(shù)科學(xué)學(xué)院主任VladoDeli?教授指出,塞爾維亞語(yǔ)在通用模型中token占比不足0.1%,遠(yuǎn)低于斯洛文尼亞語(yǔ)?!罢Z(yǔ)言模型不能只服務(wù)大語(yǔ)種,每種語(yǔ)言都應(yīng)擁有體現(xiàn)其文化身份的大模型?!睘楸苊庠卺t(yī)療、法律等關(guān)鍵領(lǐng)域出現(xiàn)誤譯風(fēng)險(xiǎn),必須構(gòu)建符合本國(guó)語(yǔ)言特點(diǎn)和文化語(yǔ)境的國(guó)家級(jí)大模型。
以色列人類語(yǔ)言技術(shù)協(xié)會(huì)創(chuàng)始人兼董事AvnerAlgom認(rèn)為“語(yǔ)言服務(wù)不能只為大語(yǔ)種設(shè)計(jì),小語(yǔ)種也應(yīng)擁有技術(shù)平權(quán)”;泰國(guó)皇家理工大學(xué)、坦亞武里皇家理工大學(xué)科學(xué)與科技學(xué)院院長(zhǎng)NipatJongsawat強(qiáng)調(diào)“語(yǔ)言主權(quán)不是選擇,而是國(guó)家的戰(zhàn)略必要”;馬來(lái)西亞拉曼理工大學(xué)企業(yè)孵化與創(chuàng)業(yè)中心副主任YuYongPoh提出“文化理解力比參數(shù)規(guī)模更重要”;柬埔寨金邊皇家大學(xué)計(jì)算機(jī)科學(xué)系教授HengSovannarith指出:“如果語(yǔ)言被技術(shù)遺忘,這個(gè)群體也會(huì)被時(shí)代遺忘。”
面對(duì)這一系列挑戰(zhàn),國(guó)際合作成為重要解決路徑。塞爾維亞諾維薩德大學(xué)技術(shù)科學(xué)學(xué)院主任VladoDeli?教授還分享了與科大訊飛的合作前景,他表示,希望通過與科大訊飛的合作,將本國(guó)語(yǔ)言技術(shù)納入全球AI生態(tài)。雙方已啟動(dòng)合作規(guī)劃,計(jì)劃將塞爾維亞語(yǔ)及相關(guān)南斯拉夫語(yǔ)言接入訊飛的翻譯設(shè)備與智能應(yīng)用系統(tǒng),并以2027年貝爾格萊德世博會(huì)為階段目標(biāo),打造本地化大模型。
此次研討會(huì)上,來(lái)自以色列的專家現(xiàn)場(chǎng)演講,伊朗專家通過在線方式參與學(xué)術(shù)交流,兩國(guó)專家在同一學(xué)術(shù)平臺(tái)上分享技術(shù)見解,展現(xiàn)了科技發(fā)揮著越來(lái)越重要的超越政治邊界的獨(dú)特力量。
以色列人類語(yǔ)言技術(shù)協(xié)會(huì)創(chuàng)始人兼董事AvnerAlgom分享了希伯來(lái)語(yǔ)AI技術(shù)發(fā)展經(jīng)驗(yàn)。他指出,希伯來(lái)語(yǔ)雖是世界上唯一被成功復(fù)興為現(xiàn)代口語(yǔ)的古老語(yǔ)言,但在自然語(yǔ)言處理領(lǐng)域仍屬低資源語(yǔ)言。
Algom強(qiáng)調(diào),語(yǔ)言服務(wù)不能只為大語(yǔ)種設(shè)計(jì),小語(yǔ)種也應(yīng)擁有技術(shù)平權(quán)。IAHLT基于開源模型,已訓(xùn)練出雙語(yǔ)大模型(希伯來(lái)語(yǔ)+英語(yǔ)),并部署于教育、客服、醫(yī)療等場(chǎng)景。通過財(cái)政激勵(lì)機(jī)制,聯(lián)合產(chǎn)業(yè)界解決數(shù)據(jù)獲取合法性、訓(xùn)練成本和落地門檻問題。
伊朗謝里夫理工大學(xué)教授HosseinAssadi在線參加了研討會(huì),他從技術(shù)架構(gòu)角度闡述了大模型發(fā)展的存儲(chǔ)基礎(chǔ)設(shè)施需求。他表示,GPU能提供每秒萬(wàn)億次浮點(diǎn)運(yùn)算,但若存儲(chǔ)系統(tǒng)無(wú)法足夠快地流式傳輸數(shù)據(jù)或處理檢查點(diǎn),強(qiáng)大算力就會(huì)變得無(wú)用。大型語(yǔ)言模型的訓(xùn)練、微調(diào)和推理過程對(duì)存儲(chǔ)系統(tǒng)提出嚴(yán)峻挑戰(zhàn),需要高帶寬、低延遲以及大容量的高效檢查點(diǎn)管理能力。當(dāng)存儲(chǔ)系統(tǒng)出現(xiàn)瓶頸時(shí),數(shù)千個(gè)GPU集群就會(huì)陷入等待狀態(tài),無(wú)法發(fā)揮計(jì)算優(yōu)勢(shì)。因此,存儲(chǔ)系統(tǒng)必須與計(jì)算能力同步擴(kuò)展,才能有效支撐大規(guī)模AI模型的運(yùn)行需求。
此次研討會(huì)還展現(xiàn)了中國(guó)多語(yǔ)言AI技術(shù)在實(shí)際應(yīng)用中的豐碩成果。隨著訊飛星火X1的全面升級(jí),其多語(yǔ)言能力擴(kuò)展至130余種,在翻譯、推理、文本生成、數(shù)學(xué)等核心能力上已能對(duì)標(biāo)國(guó)際一流大模型,特別是在幻覺治理方面取得顯著突破,大大提升了大模型在行業(yè)應(yīng)用中的可靠性。
至今,科大訊飛多語(yǔ)種技術(shù)已為華為、比亞迪、海爾等中國(guó)企業(yè)的1.2億臺(tái)套設(shè)備提供語(yǔ)音交互支持,涵蓋23種語(yǔ)言,在非洲、東南亞等國(guó)家實(shí)地落地,為“中國(guó)智造”走出去提供語(yǔ)言與AI能力保障。在AI技術(shù)生態(tài)建設(shè)方面,科大訊飛已開放813項(xiàng)AI能力接口服務(wù)全球53萬(wàn)開發(fā)者,其中272項(xiàng)AI能力專門面向多語(yǔ)種需求。
此次研討會(huì)的成功舉辦,充分體現(xiàn)了中國(guó)在全球AI治理中的積極作用。正如劉聰所言:多語(yǔ)言AI,是“一帶一路”的技術(shù)橋梁。他表示,科大訊飛將以“技術(shù)賦能+生態(tài)共建”雙輪驅(qū)動(dòng),攜手全球伙伴共建開放平臺(tái),共享技術(shù)成果和應(yīng)用場(chǎng)景,用“中國(guó)智慧”助力不同文化背景的國(guó)家彌合智能鴻溝,共同構(gòu)建更加包容、更加普惠的全球人工智能生態(tài)。
通過這次研討會(huì),各國(guó)專家達(dá)成共識(shí):在全球化深入發(fā)展的今天,多語(yǔ)言大模型不僅是技術(shù)創(chuàng)新的成果,更是推動(dòng)文明交流互鑒、構(gòu)建人類命運(yùn)共同體的重要工具。宋一晢教授所倡導(dǎo)的構(gòu)建“人民的AI”是一項(xiàng)全球共同使命,需要全球協(xié)作,確保AI技術(shù)能夠服務(wù)所有社區(qū),實(shí)現(xiàn)真正意義上的技術(shù)平權(quán)和普惠發(fā)展。
中國(guó)經(jīng)驗(yàn)為世界AI發(fā)展提供了寶貴的“第二種選擇”,讓每種語(yǔ)言——無(wú)論大小——都能擁有反映其文化身份的大語(yǔ)言模型,為全球數(shù)字文明的繁榮發(fā)展注入了新的動(dòng)力。
最有創(chuàng)意的白金小說(shuō)《唐朝好女婿》,比《狐嫁女》更刺激,哪本是你...
《唐朝好女婿》作者:秀才哥哥
高贊小說(shuō)《唐朝好女婿》,是老書蟲的最愛
熱度很高的《唐朝好女婿》,最值得回味的片段,情感大戲華麗登場(chǎng)!《唐朝好女婿》作者:秀才哥哥
榜單大神作品,老書蟲都看入迷了!《唐朝好女婿》燃爆了!
這里的確是唐朝,但和他后世了解到的大唐不太一樣-_。此時(shí)的唐朝,只是一個(gè)小國(guó),屈居于長(zhǎng)江以南的一小片土地上,而且四面都有強(qiáng)敵環(huán)伺_(tái)。這次他要上門做女婿的,是洛城的蘇家。蘇家曾經(jīng)是一個(gè)大家族,上溯三代,據(jù)說(shuō)還在朝廷做過大官-。只是時(shí)過境遷,如今的蘇家搖搖欲墜,已經(jīng)在衰落的邊緣,緊靠著家族的布匹生意希望你能滿意|-。
來(lái)源:紅網(wǎng)
作者:莊慧語(yǔ)
編輯:許佑誠(chéng)
本文為紅辣椒評(píng)論 原創(chuàng)文章,僅系作者個(gè)人觀點(diǎn),不代表紅網(wǎng)立場(chǎng)。轉(zhuǎn)載請(qǐng)附原文出處鏈接和本聲明。