新智元報道
Aeneas桃子
【新智元導(dǎo)讀】WAIC2025大會上,一套國產(chǎn)AI同傳系統(tǒng)技驚四座。從AI教父Hinton金句翻譯,到多語種實時翻譯,它實現(xiàn)了2秒極致響應(yīng),超8萬專業(yè)詞匯拿捏到位,如母語般絲滑交流。作為WAIC唯一翻譯合作伙伴,這家中國公司成為了全場矚目的焦點。
剛剛過去的WAIC大會現(xiàn)場,一套同傳系統(tǒng)徹底驚艷了全場。
AI教父Hinton的重磅演講《數(shù)字智能是否會取代生物智能》金句頻出,時不時引起全場贊嘆。
當(dāng)他用標(biāo)準(zhǔn)的倫敦腔講述自己的觀點時,幾乎就在張口的同一瞬間,標(biāo)準(zhǔn)的中文翻譯就同步出現(xiàn)了右邊的大屏上。
而在場的每一位觀眾,都能立刻秒懂對應(yīng)的英文內(nèi)容,因為右邊的字幕精準(zhǔn)、流暢,完全符合中文讀者的理解習(xí)慣。
無論是多專業(yè)的術(shù)語,多深奧的表達(dá),都能立刻被這套系統(tǒng)完美地捕捉,轉(zhuǎn)化出的翻譯極度符合語境。
演講結(jié)束后,現(xiàn)場爆發(fā)出熱烈的掌聲,可以說,一方面是出于現(xiàn)場觀眾對于AI教父精彩演講的反響,另一方面,也是對于旁邊這位由AI「國家隊」科大訊飛打造的「AI同傳」的肯定。
要知道,2018年訊飛還在和國內(nèi)其他大廠同臺競技,共同為WAIC提供AI同傳服務(wù);而到了今年,訊飛已經(jīng)成了WAIC2025的唯一翻譯合作伙伴。
走到這個位置,懂行的人都知道一款產(chǎn)品得做到多么優(yōu)秀才行。畢竟,WAIC的現(xiàn)場可隨時隨地都是真刀真槍的考驗——30多個國家、1200余位嘉賓的實時交流場景,能完美做到無障礙跨語言交流,技術(shù)門檻可謂相當(dāng)高。
七年里,究竟發(fā)生了什么,讓訊飛的產(chǎn)品成為了國際大會的AI同傳首選?
WAIC2025唯一翻譯合作伙伴
訊飛如何做到?
這,就要從以往同傳背后的重重難點說起。
很多人認(rèn)為,如今AI大模型的突飛猛進(jìn),實時語音同傳必然變得輕而易舉。
然而出乎大家意料的是,多年以來AI同傳其實都難以完全落地。
首先的一大難點,就是實時性與高延遲之間的矛盾。
因為同傳強(qiáng)調(diào)的是同步,延遲必須極短,翻譯結(jié)果必須準(zhǔn)確,還要幾乎立即同時呈現(xiàn)。在這種極端情況下,很難避免翻譯質(zhì)量的下降。
第二大難點,就是上下文語境的精準(zhǔn)理解。
人類語言中充滿了歧義、隱喻、指代,這些都需要結(jié)合上下文才能準(zhǔn)確理解。想要實時準(zhǔn)確翻譯大量專業(yè)術(shù)語,就需要提前做好知識儲備和領(lǐng)域知識建模。
一些讓人啼笑皆非的AI翻譯翻車現(xiàn)場(左右滑動查看)
更何況,大會演講者可能使用不同的方言和口音,甚至?xí)霈F(xiàn)口誤;會議的演講現(xiàn)場也環(huán)境復(fù)雜,會存在噪音、回聲、交疊說話等問題。
比如,這位日本科學(xué)院院士ToshioFukuda的日式英語,對AI同傳就是不小的挑戰(zhàn)
此外,不同語言的結(jié)構(gòu)差異,也會讓同傳的難度大大增加。比如中英文的語序截然不同,翻譯系統(tǒng)很可能需要等待一句話結(jié)束,才開始翻譯,這就會帶來嚴(yán)重的延遲。
同傳中還有一大難點,就是語音合成。在傳統(tǒng)同傳模式下,最終的翻譯由譯員的聲音播報,這使得聽感比視覺呈現(xiàn)更為流暢,不會對視覺造成干擾。
而在AI同傳要達(dá)到同樣的效果,就需要聲音快速無縫銜接,仿佛有一個真人在播報出來一樣。這就需要在技術(shù)上達(dá)到極細(xì)致的要求。
而且,同傳需要同時實現(xiàn)語音識別、語言理解、機(jī)器翻譯、語音合成等多個技術(shù)模塊的高度融合,技術(shù)鏈條復(fù)雜。
還有就是,高質(zhì)量平行語料的匱乏,也制約了模型的訓(xùn)練效果。
真正的同傳大模型,需要做到什么?
好在,現(xiàn)在不少AI同傳產(chǎn)品,開始嘗試解決這些問題,一些還取得了不錯的效果。
在國外,諸如Zoom自帶的AICompanion和ZoomInterpretation這類實時翻譯與同傳工具,能夠很好地服務(wù)于專業(yè)會議及網(wǎng)絡(luò)研討會。
不過,盡管它支持多種主流語言,集成度出色,非常適合商務(wù)場合使用,但翻譯質(zhì)量尚有提升空間,且價格偏高,部分高級功能還需通過付費訂閱來解鎖。
MicrosoftTeams,也可以通過集成Azure的語音識別和翻譯服務(wù),從而實現(xiàn)多語種的字幕和翻譯,能支持70+種語言。
它的翻譯倒是很流暢,然而缺點也很明顯:設(shè)置復(fù)雜,需要一定的技術(shù)集成能力,這就大大提升了門檻,不適合亟需翻譯場景的小白用戶。
谷歌家當(dāng)然也少不了類似產(chǎn)品。
比如GoogleMeet內(nèi)置字幕功能+自定義集成GoogleTranslate,就能實現(xiàn)AI同傳。
這個產(chǎn)品的特點是延遲低,非常適合教育和遠(yuǎn)程協(xié)作。然而它的翻譯精度嚴(yán)重依賴語境,在專業(yè)術(shù)語的翻譯上時常出現(xiàn)翻車的情況。
視頻中可以看出,GoogleMeet在英語和西語的互譯上延遲極低,效果不錯
在國內(nèi),許多AI同傳產(chǎn)品完全不輸外國AI。
其中,作為WAIC2025的唯一合作伙伴,科大訊飛在AI同傳領(lǐng)域尤為引人注目。
縱觀市場上的主流AI同傳產(chǎn)品,競爭的焦點普遍集中在延遲、專業(yè)術(shù)語準(zhǔn)確度、多語言支持以及語音效果等關(guān)鍵指標(biāo)上。
在這些方面,訊飛星火語音同傳大模型均表現(xiàn)出色。
以往很多傳統(tǒng)的同傳大模型,基本上采取傳統(tǒng)的「語音識別+文本翻譯+語音合成」串聯(lián)模式,上文所提到的種種弊病,都難以打破。
然而所有這些「魔咒」,卻都被科大訊飛的星火語音同傳大模型克服了。
該模型基于機(jī)器學(xué)習(xí)(ML)和大規(guī)模語言模型技術(shù),實現(xiàn)端到端語音實時翻譯。
基于星火X1底座,其在四大維度——翻譯效果、響應(yīng)時間、專業(yè)覆蓋、語音品質(zhì)上,呈現(xiàn)出系統(tǒng)性領(lǐng)先優(yōu)勢,而非單點技術(shù)突破。
它模擬了人類譯員思維鏈路,通過智能意群切分、上下文精準(zhǔn)選詞和碎片化信息重組,實現(xiàn)了無縫的跨語言實時交流。
在實時性、準(zhǔn)確性和專業(yè)性上,它在行業(yè)內(nèi)都做到了最優(yōu),如母語般絲滑交流。
在保證翻譯質(zhì)量的同時,模型實現(xiàn)了2秒極致響應(yīng),達(dá)到人類頂尖同傳譯員的水平。
全新升級的語音同傳大模型,針對醫(yī)療、制造業(yè)、金融等高壁壘專業(yè)領(lǐng)域深度優(yōu)化,覆蓋了超8萬個專業(yè)詞匯。
實測顯示,專業(yè)內(nèi)容翻譯得分超90分,業(yè)內(nèi)率先達(dá)到「可用」標(biāo)準(zhǔn)。
此外,其智能雙語識別功能,在中英文混合發(fā)言的情況下,也能自動切換翻譯方向。
要知道,真正的同傳大模型,絕不能僅僅是翻譯工具,而是一種交流方式的徹底革命。
在這次Hinton演講的同傳任務(wù)中,星火語音同傳大模型的表現(xiàn),實在可以稱得上是國民級AI同傳的水平,在全世界觀眾面前都十分拿得出手。
比如,當(dāng)Hinton講到關(guān)于同一個詞語意義的兩種不同理論時,大模型在屏幕右側(cè)迅速給出了正確通順的翻譯——
「為了捕捉意義,我們需要一種類似關(guān)系圖的東西,心理學(xué)家曾相信一種截然不同的理論,即一個詞的意義只是一大堆語義和句法特征」
這種學(xué)術(shù)性和專業(yè)性非常高的知識,大模型能夠即時給出足夠精準(zhǔn)的翻譯,能力可見一斑。
可以說,當(dāng)競品還在苦苦追趕「能用」的水平時,星火已經(jīng)狂飆到「好用」的境界,堪稱AI同傳界的「卷王」。
國內(nèi)首個同傳大模型
訊飛何以快人一步?
要說現(xiàn)在國內(nèi)做語音同傳最牛的,訊飛可真是獨一檔的存在,其他家還沒有誰能跟上這個節(jié)奏。
而這個成就,可不是一夜之間取得的。可以說,訊飛的硬核實力,靠的是20多年來在語音技術(shù)領(lǐng)域的「死磕」。
早在2010年,這家公司就Allin深度學(xué)習(xí)搭上AI快車,成為了全球最早一批搞機(jī)器學(xué)習(xí)的玩家。
一年后,其自研的基于深度神經(jīng)網(wǎng)絡(luò)「中文語音識別系統(tǒng)」正式上線,直接把行業(yè)甩在了身后。
這些都為后來的技術(shù)演進(jìn)埋下了關(guān)鍵伏筆。
此后數(shù)年,訊飛在技術(shù)和應(yīng)用上雙線狂飆,拿獎拿到手軟——
2018年,訊飛機(jī)器翻譯口譯能力首次拿下了CATTI翻譯資格考試;2019年,其機(jī)器閱讀理解能力,在全球首次超越人類平均水平。
在語音識別上,2016-2023年,訊飛連獲國際多通道語音分離和識別大賽CHiME五連冠;在多語種翻譯上,又在2021-2023年連續(xù)三屆拿下IWSLT冠軍。
如今星火大模型的快速迭代,直接把科大訊飛的技術(shù)底盤又往上拉了一層。
WAIC上,星火X1基于全國產(chǎn)算力平臺「飛星一號」,采用端到端架構(gòu),直接把傳統(tǒng)「語音識別-翻譯-語音合成」三步流程簡化成一步,極大提升效率、降低延遲。
這也就是為什么,我們能看到Hinton說話和字幕的出現(xiàn)做到了神同步。
而且,基于X1的多語言能力,星火同傳大模型不僅能「聽懂」復(fù)雜語境,還能精準(zhǔn)捕捉語義、語調(diào)和專業(yè)術(shù)語,全場絲滑無壓力。
而這背后,都是訊飛多年來廣泛積累的數(shù)據(jù)在做支撐——他們已經(jīng)為全球超過40萬場國際會議做過同傳,數(shù)據(jù)維度廣,最不缺的就是覆蓋多語種、多場景的真實語料,堪稱行業(yè)翹楚。
更不要說,訊飛的開放平臺上,還擁有廣大的52萬海外開發(fā)者。這就讓數(shù)據(jù)池源源不斷,生態(tài)持續(xù)壯大。
總之,訊飛實打?qū)嵉亟?jīng)歷了一場場真金白銀的考驗——從北京冬奧會、進(jìn)博會,再到聯(lián)合國會議,無論是多么高規(guī)格的國際場合,它的AI同傳技術(shù)都能carry全場,在每一次實戰(zhàn)中都獲得了滿場稱贊。
可以說,訊飛能在全球的AI同傳領(lǐng)域穩(wěn)站C位,靠的就是一步步打出來的技術(shù)和經(jīng)驗。
而現(xiàn)在國內(nèi)首個同傳大模型的發(fā)布,更是代表著全新的里程碑。不僅訊飛交出了漂亮的成績單,在全球賽道上沖到了最前排,也讓人類的「語言無障礙」變得越來越近了。
軟硬一體,用「服務(wù)閉環(huán)」征服WAIC
WAIC上,訊飛不僅以技術(shù)實力霸屏?xí)?,更通過「軟硬一體」的戰(zhàn)略,完美適配了國際會議的復(fù)雜場景。
這一現(xiàn)象背后,折射出AI同傳技術(shù)的新趨勢以及市場競爭的新格局。
當(dāng)前來看,AI同傳市場早已從單一技術(shù)輸出,轉(zhuǎn)向了生態(tài)的競爭。一些單一技術(shù)提供商或純軟件方案,往往在復(fù)雜場景下適配性不足。
訊飛軟硬一體戰(zhàn)略,并非是簡單的產(chǎn)品堆疊,而是以星火「全家桶」為核心,通過硬件協(xié)作持續(xù)放大的技術(shù)能力。
舉個栗子,首款搭載離線LLM翻譯設(shè)備「訊飛雙屏翻譯機(jī)2.0」,能精準(zhǔn)分離多方發(fā)言,自動切換翻譯方向,延遲率非常低。
WAIC展覽館中,一位來自泰國Omniscien公司的CTODionWiggins對訊飛的多語種透明屏技術(shù)贊不絕口。
不僅如此,AI同傳的競爭已從算法精度轉(zhuǎn)向了場景適配能力,而硬件是實現(xiàn)這一躍遷的關(guān)鍵。
相較于純軟件方案,訊飛翻譯硬件通過場景化設(shè)計,能夠直接觸達(dá)用戶需求。
WAIC現(xiàn)場3款新系列的訊飛AI錄音筆的首秀,分別針對學(xué)生、職場人、商務(wù)人士提供了定制化需求,并覆蓋了課堂、辦公等多種場景。
還有訊飛同傳和同傳耳機(jī)的協(xié)作,進(jìn)一步放大了星火大模型的能力。
WAIC參會者通過耳機(jī)收聽AI合成的語音,再結(jié)合屏幕的實時字幕,即能體驗「聽譯同步」的沉浸式溝通。
更重要的是,訊飛的軟硬件協(xié)作邏輯,不僅在于單一設(shè)備的突破,更在于多設(shè)備的協(xié)同,形成了覆蓋WAIC全場景的「服務(wù)閉環(huán)」。
在大會的翻譯服務(wù)點,訊飛還提供了現(xiàn)場租借的翻譯機(jī),讓參會者即拿即用,與全球同行無障礙交流。
這屆WAIC大會,涵蓋了開幕式、3場主論壇,以及19場分論壇,涉及到多語言、多場景的并發(fā)需求。
訊飛同傳通過大屏幕實時呈現(xiàn)多語種字幕,為開幕式和分論壇的順利溝通提供了保障。
這種從前端硬件到后端服務(wù)的閉環(huán)能力,恰恰體現(xiàn)了訊飛對國際會議場景的深刻洞察,也彰顯了其硬件賦能在提升服務(wù)效率上的核心價值。
當(dāng)然了,能成為國際會議翻譯唯一合作伙伴,不僅要技術(shù)和服務(wù)過硬,還需強(qiáng)大的品牌背書。
如上所述,從2018年首屆WAIC開始,訊飛就承包了翻譯重任,為各路AI大牛們「搭橋」。
如今,訊飛憑借其「全棧式」AI同傳解決方案,構(gòu)建了「軟件+硬件+服務(wù)」三位一體的核心競爭力,以技術(shù)突破與生態(tài)協(xié)同重塑行業(yè)標(biāo)準(zhǔn)。
放眼未來,AI同傳在教育、旅游、醫(yī)療等領(lǐng)域進(jìn)一步滲透,硬件賦能將成為技術(shù)落地的關(guān)鍵驅(qū)動力。
訊飛將帶領(lǐng)行業(yè)打破語言壁壘,登上「巴別塔」之巔,讓全球溝通更加高效、自然。
火爆全網(wǎng)的《邪王寵妻:廢材狂妃要逆天》,經(jīng)典名場面,傲嬌男主要...
《邪王寵妻:逆天煉術(shù)師》斯文男主x寶藏女孩,愿得一人心,白首不相離
不忍放手的私藏讀物《邪王寵妻:廢材狂妃要逆天》,熬夜吃狗糧也...
免責(zé)聲明:本文內(nèi)容由開放的智能模型自動生成,僅供參考。