AI風(fēng)暴席卷全球的第三個年頭,開源大模型始終是行業(yè)重點攻堅目標(biāo)。截止目前,GUI開源大模型已經(jīng)走過概念驗證階段,逐步向場景調(diào)優(yōu)、端側(cè)部署等生態(tài)維度延伸,不僅要拼參數(shù)、拼執(zhí)行力,也要拼場景落地能力,各家大廠的技術(shù)競賽已然進入決勝階段。
在此階段,開源與合作是一個繞不開的焦點,7月26日在上海揭幕的世界人工智能大會(WAIC)上,這也是行業(yè)貫穿始終的核心議題。
在此次WAIC人工智能標(biāo)準(zhǔn)化國際合作論壇上,榮耀作為首批單位,攜手阿里、百度等百余家行業(yè)領(lǐng)軍企業(yè)共同發(fā)布《智能體協(xié)議共建共享聯(lián)合倡議》,進一步推動行業(yè)標(biāo)準(zhǔn)化發(fā)展和國際合作。同時,榮耀還帶來了全新驚喜:MagicGUI大模型正式發(fā)布并開源。
事實上,國內(nèi)的大模型開源早已從星星之火演變成燎原之勢,前有DeepSeek-V3、DeepSeek-R1以千億參數(shù)構(gòu)筑智能基座,后有阿里、字節(jié)、榮耀等科技巨頭紛紛加碼。對比之下,硅谷眾大廠似乎正“逆流”而行,Meta的Llama、谷歌的Gemma等雖然也開放了部分使用和修改權(quán)限,但并未公開訓(xùn)練數(shù)據(jù)集、仍在限制開發(fā)選項,很難稱得上真正的開源。
大模型的競爭來到這個階段,開源的重要意義正在凸顯:不僅事關(guān)技術(shù)平權(quán)和產(chǎn)業(yè)創(chuàng)新,更是構(gòu)建AI商業(yè)生態(tài),加速技術(shù)擴散以換取長期價值的關(guān)鍵。要抹平中外發(fā)展時間差、在產(chǎn)業(yè)落地階段搶得先機,就要合全行業(yè)開發(fā)者之力,通過數(shù)以億計的微調(diào)催生“鏈?zhǔn)椒磻?yīng)”,打破外國巨頭的“算力霸權(quán)”——開源是必然選擇。
在此背景下,榮耀MagicGUI面向全球軟硬件開發(fā)者正式開源。這不僅是榮耀的首個開源GUI大模型,也是其“阿爾法戰(zhàn)略”的重要里程碑:高達(dá)70億的參數(shù)規(guī)模,基于榮耀MagicV5常用場景用機操控準(zhǔn)確率達(dá)到91.5%,較業(yè)內(nèi)同類頂級開源模型高出16.4%,性能足以比肩SOTA。(SOTA是"StateoftheArt"的縮寫,中文可譯為“最先進的”,常用于描述某一領(lǐng)域當(dāng)前技術(shù)或模型的最高水平。例如,在人工智能領(lǐng)域,SOTA模型指在特定任務(wù)中性能最優(yōu)的模型,如數(shù)學(xué)證明、自然語言處理等方向。)
詳細(xì)拆解之下,MagicGUI在GUI數(shù)據(jù)采集框架、知識數(shù)據(jù)構(gòu)建方法、動作空間定義等維度都有一系列開創(chuàng)性成果,比如構(gòu)建了全新的數(shù)據(jù)采集與構(gòu)建框架,優(yōu)化了數(shù)據(jù)配比與篩選方案,在此基礎(chǔ)上構(gòu)建了多樣且高質(zhì)量的數(shù)據(jù)集。但其最具突破性的能力,在于對兩大訓(xùn)練階段——繼續(xù)預(yù)訓(xùn)練和強化微調(diào)的迭代創(chuàng)新。
首先,在繼續(xù)預(yù)訓(xùn)練階段,MagicGUI重點改進數(shù)據(jù)處理、合成數(shù)據(jù)等環(huán)節(jié),目的是夯實基礎(chǔ)能力,全方位提升大模型在推理、規(guī)劃、動作執(zhí)行上的綜合表現(xiàn)。
比如在數(shù)據(jù)處理環(huán)節(jié)中,MagicGUI通過過濾相似、重復(fù)數(shù)據(jù),搭配啟發(fā)式規(guī)則和開源模型評估,多重篩選、攔截掉低質(zhì)數(shù)據(jù)。合成數(shù)據(jù)環(huán)節(jié)同樣以提高數(shù)據(jù)質(zhì)量為目的,一邊結(jié)合UI元素類別、空間位置、形狀等維度合成更全面的UI描述數(shù)據(jù)集,一邊優(yōu)化開源模型,批量合成多難度層次指令數(shù)據(jù)。
其次,強化微調(diào)訓(xùn)練階段,MagicGUI采用了極具創(chuàng)新性的采樣策略——GRPO雙重過濾方案。
所謂雙重過濾,即靜態(tài)過濾與動態(tài)過濾的結(jié)合:一方面,通過靜態(tài)過濾剔除生成響應(yīng)中始終給出完全正確/錯誤預(yù)測的樣本,專注于更有挑戰(zhàn)性和信息量的樣本;另一方面則借助動態(tài)過濾模式,不對全部正確/錯誤的結(jié)果進行訓(xùn)練,保證強化微調(diào)效果。
技術(shù)上的突破有沒有價值,不能光靠參數(shù)說話,落地到應(yīng)用側(cè)的效果也是重要檢驗標(biāo)準(zhǔn)。可喜的是,我們已經(jīng)能看到榮耀MagicGUI借助關(guān)鍵能力突破,落地應(yīng)用榮耀MagicV5等一系列成果,以及對用戶實際生活的幫助。
比如通過一語多平臺打車功能,用戶只需一句話就能在高德、滴滴等主流APP自動完成叫車,此外還可以輕松完成打開APP、修改地址、選擇車型等細(xì)致的指令。而在這背后,想必少不了MagicGUI單步操作等關(guān)鍵能力的進步。
不積跬步無以至千里,GUI大模型的研發(fā)與創(chuàng)新從來不是一蹴而就的,更像是一場比拼耐力的馬拉松。在MagicGUI的發(fā)布,承載著榮耀長期、大力度、毫不保留的資源與人才投入。
當(dāng)然,展望未來,相信中國科技企業(yè)也不會停下繼續(xù)探索的步伐。目前GUI開源大模型仍有不少困擾整個行業(yè)的難題有待解決,如OOD泛化、安全與隱私保護等。
這些難題既是各大科技巨頭的挑戰(zhàn),也是機會。誰能搶先一步取得下一階段的突破性進展,誰就更有機會搶到技術(shù)話語權(quán)——而到最終,技術(shù)層面上的創(chuàng)新還是會落地產(chǎn)業(yè)、應(yīng)用,給開發(fā)者、用戶帶去實打?qū)嵉谋憷c體驗優(yōu)化。
《閃亮新主播》十強現(xiàn)狀:最帥主播被棄用,有人跳樓,吳昕讓人失望...
何炅不避諱,謝娜上浪姐,維嘉吳昕合體,《快本》停播原因清晰了
湖南跨年晚會:汪涵謝娜淚灑舞臺,楊紫美艷驚艷,蔡依林力撐門面
免責(zé)聲明:本文內(nèi)容由開放的智能模型自動生成,僅供參考。