陽(yáng)飛燕
本文第一作者是徐婷,是香港中文大學(xué)博士生,主要研究興趣是大模型的后訓(xùn)練;通訊作者分別是黃志超和程善伯,來(lái)自字節(jié)跳動(dòng)Seed團(tuán)隊(duì)。
你是否經(jīng)歷過(guò)這樣的場(chǎng)景:觀(guān)看一場(chǎng)激動(dòng)人心的全球發(fā)布會(huì),AI字幕卻總是慢半拍,等你看到翻譯,臺(tái)上的梗已經(jīng)冷掉了。
或者,在跨國(guó)視頻會(huì)議上,機(jī)器翻譯的質(zhì)量時(shí)好時(shí)壞,前言不搭后語(yǔ),讓人啼笑皆非。
這就是同聲傳譯(SimultaneousMachineTranslation,SiMT)領(lǐng)域一直以來(lái)的核心技術(shù)挑戰(zhàn):“質(zhì)量-延遲”權(quán)衡問(wèn)題(Quality-LatencyTrade-off)。
現(xiàn)在,這些問(wèn)題迎來(lái)了新的解決方案。來(lái)自香港中文大學(xué)、字節(jié)跳動(dòng)Seed和斯坦福大學(xué)的研究團(tuán)隊(duì)聯(lián)手提出了一種面向同聲傳譯的序貫策略?xún)?yōu)化框架(SequentialPolicyOptimizationforSimultaneousMachineTranslation,SeqPO-SiMT)。
該方法將同傳任務(wù)巧妙地建模為序貫決策過(guò)程,通過(guò)優(yōu)化完整的決策序列,顯著提升了翻譯質(zhì)量,同時(shí)有效控制了延遲,其性能直逼、甚至在某些方面超越了同等大小的離線(xiàn)翻譯模型。
論文標(biāo)題:SeqPO-SiMT:SequentialPolicyOptimizationforSimultaneousMachineTranslation
研究背景
同聲傳譯的核心在于機(jī)器需要?jiǎng)討B(tài)地決定“繼續(xù)聽(tīng)”(READ)還是“開(kāi)始說(shuō)”(WRITE)。這個(gè)決策直接影響最終的翻譯效果。例如,當(dāng)模型接收到英文單詞“bark”時(shí),它面臨一個(gè)困境:如果立即翻譯,可能會(huì)譯為“狗叫”,但若后文出現(xiàn)“ofthetree”,則正確翻譯應(yīng)為“樹(shù)皮”。
傳統(tǒng)的同傳方法,它每一步?jīng)Q策(是繼續(xù)聽(tīng),還是開(kāi)始翻譯)都是孤立的。它可能會(huì)因?yàn)檠矍暗摹靶±保ū热绶g出一個(gè)詞)而犧牲掉全局的“大利”(整個(gè)句子的流暢度和準(zhǔn)確性)。
核心方法
針對(duì)這一難點(diǎn),該論文提出了SeqPO-SiMT框架。其核心思想是將同聲傳譯任務(wù)建模為一個(gè)序貫決策問(wèn)題,綜合評(píng)估整個(gè)翻譯流程的翻譯質(zhì)量和延遲,并對(duì)整個(gè)決策序貫進(jìn)行端到端的優(yōu)化。
該方法的主要特點(diǎn)是:它不再孤立地評(píng)估每一步?jīng)Q策的好壞,而是將一整句話(huà)的翻譯過(guò)程(即一個(gè)完整的決策序貫)視為一個(gè)整體,更符合人類(lèi)對(duì)同傳的評(píng)估過(guò)程。
其中,λ是一個(gè)超參數(shù),用于權(quán)衡質(zhì)量與延遲的重要性。
實(shí)驗(yàn)結(jié)果與分析
為了驗(yàn)證方法的有效性,研究者們?cè)诙鄠€(gè)公開(kāi)的英漢互譯測(cè)試集上進(jìn)行了實(shí)驗(yàn),并與多種現(xiàn)有的同傳模型進(jìn)行了對(duì)比。實(shí)驗(yàn)結(jié)果顯示:在低延遲水平下,SeqPO-SiMT框架生成的譯文質(zhì)量相較于基線(xiàn)模型有明顯提升。
本文將SeqPO-SiMT的實(shí)時(shí)同傳結(jié)果與多個(gè)高性能模型的離線(xiàn)翻譯結(jié)果進(jìn)行對(duì)比。結(jié)果顯示,SeqPO-SiMT的翻譯質(zhì)量不僅優(yōu)于監(jiān)督微調(diào)(SFT)的離線(xiàn)模型及LLaMA-3-8B,其表現(xiàn)甚至能媲美乃至超越Qwen-2.5-7B的離線(xiàn)翻譯水平。這表明該方法在70億參數(shù)(7B)規(guī)模上實(shí)現(xiàn)了業(yè)界頂尖(SoTA)的性能。
總結(jié)與討論
總的來(lái)說(shuō),SeqPO-SiMT這項(xiàng)工作的主要貢獻(xiàn)在于,為解決同聲傳譯中的質(zhì)量-延遲權(quán)衡問(wèn)題提供了一個(gè)新的視角。它強(qiáng)調(diào)了對(duì)決策“序貫”進(jìn)行整體優(yōu)化的重要性。該研究提出的方法,對(duì)于需要進(jìn)行實(shí)時(shí)、連續(xù)決策的自然語(yǔ)言處理任務(wù)具有一定的參考意義,并為未來(lái)開(kāi)發(fā)更高效、更智能的同聲傳譯系統(tǒng)提供了有價(jià)值的探索。
王國(guó)維與中國(guó)文藝復(fù)興:美育思想與《人間詞話(huà)》的美學(xué)革新
王國(guó)維這一生中,始終堅(jiān)持倡導(dǎo)治學(xué)的“三重境界”-_。但是,由于王國(guó)維本人過(guò)于追求獨(dú)特個(gè)性,又脫離了整個(gè)社會(huì)的發(fā)展趨勢(shì),因此他不得不在悲劇中度過(guò)自己的下半生,并最終走向一條不歸路。作為中國(guó)近代最后一位重要的美學(xué)和文學(xué)思想家,王國(guó)維試圖將西方美學(xué)理論與中國(guó)傳統(tǒng)美學(xué)相融合_-。而《美學(xué)三境》這本書(shū),則是其探等會(huì)說(shuō)|-。
從悲劇美學(xué)角度解讀《紅樓夢(mèng)》:王國(guó)維的視角與影響
該書(shū)深入探討美學(xué)三境,結(jié)合古今中外的多元視角和豐富理論,對(duì)國(guó)內(nèi)的美學(xué)、哲學(xué)、教育等多個(gè)領(lǐng)域進(jìn)行了系統(tǒng)而深刻的闡述_-。他的文章不僅發(fā)表于《教育世界》和《東方雜志》,更展現(xiàn)了嚴(yán)謹(jǐn)?shù)奈娘L(fēng)和獨(dú)到的見(jiàn)解。在晚清閉關(guān)鎖國(guó)的大背景下,王國(guó)維的觀(guān)點(diǎn)既新穎又獨(dú)特,即便放在當(dāng)今數(shù)據(jù)時(shí)代和地球村的視角下品讀,依然能讓希望你能滿(mǎn)意-。
“霧里看花”“芙蓉出水”,孰美——我看王國(guó)維的“隔”與“不隔”
王國(guó)維的獨(dú)特貢獻(xiàn)在于他打破了傳統(tǒng)道德倫理的束縛,巧妙地將西方美學(xué)理論融入中國(guó)傳統(tǒng)美學(xué)之中,從而將美學(xué)提升到了生存本體論的高度。他的核心美學(xué)主張是“境界說(shuō)”,這一觀(guān)點(diǎn)在《人間詞話(huà)》中得到了充分體現(xiàn)。王國(guó)維指出,成大事者必須經(jīng)歷三種境界:“昨夜西風(fēng)凋碧樹(shù),獨(dú)上高樓望盡天涯路|。”這是第一境界,描繪了等會(huì)說(shuō)_。
來(lái)源:紅網(wǎng)
作者:利采萱
編輯:煙凌寒
本文為紅辣椒評(píng)論 原創(chuàng)文章,僅系作者個(gè)人觀(guān)點(diǎn),不代表紅網(wǎng)立場(chǎng)。轉(zhuǎn)載請(qǐng)附原文出處鏈接和本聲明。