叔雅旋
智東西作者陳駿達(dá)編輯云鵬
智東西7月23日?qǐng)?bào)道,就在剛剛,阿里巴巴Qwen團(tuán)隊(duì)開(kāi)源了其最新一代旗艦編程模型Qwen3-Coder-480B-A35B-Instruct。Qwen團(tuán)隊(duì)稱,這是該團(tuán)隊(duì)迄今為止最強(qiáng)大的開(kāi)源智能體編程模型,擁有480B參數(shù),激活參數(shù)為35B,原生支持256K上下文,并可通過(guò)外推擴(kuò)展至100萬(wàn)上下文(輸入),其最大輸出為6.5萬(wàn)token。
在基準(zhǔn)測(cè)試中,Qwen3-Coder在編程和智能體任務(wù)上擁有不錯(cuò)的性能,于AgenticCoding(智能體編程)、AgenticBrowser-Use(智能體瀏覽器使用)和AgenticTool-Use(智能體工具調(diào)用)三類任務(wù)中獲得了開(kāi)源SOTA,超過(guò)KimiK2、DeepSeekV3等開(kāi)源模型和GPT-4.1等閉源模型,并可與ClaudeSonnet4這一以編程能力著稱的模型相媲美。
Qwen3-Coder將提供多種尺寸,本次開(kāi)源的是其最強(qiáng)大的變體,其參數(shù)量超過(guò)了阿里旗艦?zāi)P蚎wen3的235B(2350億),小于KimiK2的1T(1萬(wàn)億)。據(jù)阿里官方介紹,借助Qwen3-Coder,剛?cè)胄械某绦騿T一天就能完成資深程序員一周的工作,生成一個(gè)品牌官網(wǎng)最快只需5分鐘。
除了模型之外,Qwen還開(kāi)源了一個(gè)由GeminiCode分叉而來(lái)的智能體編程命令行工具——QwenCode,這一工具進(jìn)行了定制提示和函數(shù)調(diào)用協(xié)議的適配,能更充分的釋放Qwen3-Coder在智能體編程任務(wù)上的能力。
這一模型已在阿里云旗下大模型服務(wù)平臺(tái)百煉上線,其API采用了階梯計(jì)費(fèi)的方式,根據(jù)輸入token量調(diào)整價(jià)格。在256K~1M一檔,其輸入價(jià)格為6美元/百萬(wàn)token,輸出價(jià)格為60美元/百萬(wàn)token。相比之下,ClaudeSonnet4的輸入輸出價(jià)格分別為3美元/百萬(wàn)token、15美元/百萬(wàn)token,與Qwen3-Coder128k~256k一檔的價(jià)格持平。
Qwen3-Coder也已在QwenChat網(wǎng)頁(yè)版上線,用戶可免費(fèi)體驗(yàn)。此外,其480B版本已在HuggingFace、魔搭等開(kāi)源社區(qū)發(fā)布,可供下載和本地部署。Qwen還在一篇博客文章中詳細(xì)分享了模型的技術(shù)細(xì)節(jié)。
模型開(kāi)源地址:https://huggingface.co/Qwen
QwenCode開(kāi)源地址:https://github.com/QwenLM/qwen-code
博客地址:https://qwenlm.github.io/blog/qwen3-coder/
一、深夜上線QwenChat,海外網(wǎng)友已經(jīng)玩瘋了
在Qwen團(tuán)隊(duì)官宣Qwen3-Coder發(fā)布前,這一模型已經(jīng)悄然在QwenChat官網(wǎng)上線,手速快的海外網(wǎng)友們貢獻(xiàn)了一批實(shí)測(cè)案例。
這一案例讓Qwen3-Coder打造一個(gè)Wordle單詞游戲,規(guī)則是在六次嘗試中猜出一個(gè)長(zhǎng)度為5個(gè)字母的單詞。最終,Qwen3-Coder交付的游戲頁(yè)面和源代碼如下。
提供案例的網(wǎng)友稱,Qwen3-Coder在指令遵循、UI設(shè)計(jì)、動(dòng)畫(huà)方面的能力驚人,大部分測(cè)試結(jié)果一次就跑通了,完全不需要推理。不過(guò),在Wordle游戲設(shè)計(jì)這一任務(wù)上,Qwen并沒(méi)有使用單詞解析器,也沒(méi)有引用來(lái)源,而是決定自行枚舉所有5個(gè)字母的單詞。
在一則找不同游戲的開(kāi)發(fā)案例中,可以看到與昨日發(fā)布的Qwen3-235B-A22B-2507相比,Qwen3-Coder在審美和完成度上要明顯好于前者。
智東西則嘗試讓Qwen3-Coder開(kāi)發(fā)一個(gè)中英文術(shù)語(yǔ)庫(kù),并支持增刪改查的基礎(chǔ)功能??梢灾庇^感受到,由于并未開(kāi)啟推理,Qwen3-Coder的開(kāi)發(fā)速度極快,20多秒便完成了初步結(jié)果,在對(duì)其生成結(jié)果進(jìn)行進(jìn)一步修改時(shí),速度同樣較快。
其最終生成的結(jié)果從UI角度上看的確美觀清晰,功能運(yùn)轉(zhuǎn)正常,不過(guò)并沒(méi)有遵循提示詞中使用PHP+MySQL進(jìn)行開(kāi)發(fā)的指令。其最終交付的結(jié)果作為功能演示、原型展示完全足夠,但在真實(shí)部署場(chǎng)景中的可擴(kuò)展性還需進(jìn)一步優(yōu)化。
智東西還讓Qwen3-Coder給自己出了一道3DHTML開(kāi)發(fā)題,內(nèi)容是創(chuàng)建一個(gè)3D旋轉(zhuǎn)的立方體展示臺(tái),六個(gè)面顯示不同顏色,自動(dòng)旋轉(zhuǎn),添加光照效果和陰影等。Qwen3-Coder交付的結(jié)果完成度不錯(cuò),基本實(shí)現(xiàn)了主要功能,旋轉(zhuǎn)動(dòng)效、陰影等處理到位。
編程能力之外,Qwen3-Coder還提供了許多其他的玩法,包括圖像生成、視頻生成等,并支持文檔、圖片、視頻、音頻等內(nèi)容的上傳,這可能是通過(guò)工具調(diào)用實(shí)現(xiàn)的。
正式發(fā)布后,Qwen官方也提供了Qwen3-Coder的部分用例。
例如,可以讓其打造一個(gè)基于物理的煙囪拆除模擬,具有受控爆炸。
打造可互動(dòng)的太陽(yáng)系模擬,行星之間的關(guān)系基本準(zhǔn)確。
開(kāi)發(fā)出的網(wǎng)頁(yè)小游戲完成度不錯(cuò)。
二、預(yù)訓(xùn)練仍有擴(kuò)展空間,在20000個(gè)獨(dú)立環(huán)境進(jìn)行強(qiáng)化學(xué)習(xí)
Qwen團(tuán)隊(duì)在技術(shù)博客中分享了Qwen3-Coder的部分訓(xùn)練細(xì)節(jié),該團(tuán)隊(duì)認(rèn)為,目前預(yù)訓(xùn)練仍有進(jìn)一步的擴(kuò)展空間。
預(yù)訓(xùn)練階段,Qwen3-Coder使用了7.5萬(wàn)億token數(shù)據(jù),其中代碼占比70%,因此,模型在編程方面表現(xiàn)出色,同時(shí)也保留了通用和數(shù)學(xué)能力。
上下文方面,Qwen3-Coder原生支持256K上下文,并可通過(guò)YaRN擴(kuò)展至1M,針對(duì)倉(cāng)庫(kù)規(guī)模和動(dòng)態(tài)數(shù)據(jù)(例如拉取請(qǐng)求)進(jìn)行了優(yōu)化,從而適配智能體編程場(chǎng)景。
Qwen3-Coder的上一代模型Qwen2.5-Coder被運(yùn)用于擴(kuò)展合成數(shù)據(jù),具體而言,Qwen2.5清洗并重寫(xiě)了噪聲數(shù)據(jù),提升了整體數(shù)據(jù)質(zhì)量。
后訓(xùn)練階段,Qwen團(tuán)隊(duì)認(rèn)為,與普遍關(guān)注競(jìng)賽級(jí)代碼生成不同,所有代碼任務(wù)都天然適合執(zhí)行驅(qū)動(dòng)(execution-driven)的大規(guī)模強(qiáng)化學(xué)習(xí)。該團(tuán)隊(duì)在更廣泛的現(xiàn)實(shí)世界編程任務(wù)上擴(kuò)大了代碼強(qiáng)化學(xué)習(xí)訓(xùn)練規(guī)模。
通過(guò)自動(dòng)擴(kuò)展多樣化編程任務(wù)的測(cè)試用例,Qwen團(tuán)隊(duì)創(chuàng)建了高質(zhì)量的訓(xùn)練實(shí)例,進(jìn)一步釋放了強(qiáng)化學(xué)習(xí)的潛力。這不僅提高了代碼執(zhí)行成功率,還為其他任務(wù)帶來(lái)了收益。
這也啟發(fā)該團(tuán)隊(duì)進(jìn)一步探索難以解決,卻易于驗(yàn)證的任務(wù)類型,這有望成為強(qiáng)化學(xué)習(xí)的沃土。
在現(xiàn)實(shí)世界的軟件工程任務(wù)(例如SWE-Bench)中,Qwen3-Coder必須與環(huán)境進(jìn)行多輪交互,涉及規(guī)劃、使用工具、接收反饋和做出決策。在Qwen3-Coder的后訓(xùn)練階段,Qwen團(tuán)隊(duì)引入了長(zhǎng)視距強(qiáng)化學(xué)習(xí)(智能體強(qiáng)化學(xué)習(xí)),鼓勵(lì)模型通過(guò)使用工具進(jìn)行多輪交互來(lái)解決現(xiàn)實(shí)世界任務(wù)。
智能體強(qiáng)化學(xué)習(xí)的關(guān)鍵挑戰(zhàn)在于環(huán)境擴(kuò)展。為解決這一問(wèn)題,該團(tuán)隊(duì)構(gòu)建了一個(gè)可擴(kuò)展的系統(tǒng),能夠并行運(yùn)行20000個(gè)獨(dú)立環(huán)境。該基礎(chǔ)設(shè)施為大規(guī)模強(qiáng)化學(xué)習(xí)提供了必要的反饋,并支持大規(guī)模評(píng)估。
因此,Qwen3-Coder在SWE-BenchVerified中實(shí)現(xiàn)了開(kāi)源模型中的最佳性能,且無(wú)需使用推理(測(cè)試時(shí)擴(kuò)展)。
同時(shí)開(kāi)源的QwenCode是一個(gè)用于研究目的的命令行界面(CLI)工具,基于GeminiCLI開(kāi)發(fā),針對(duì)Qwen-Coder模型進(jìn)行了增強(qiáng)的解析器和工具支持。
除了QwenCode,還可以使用ClaudeCode與Qwen3-Coder一起編程。只需在Dashscope平臺(tái)上申請(qǐng)一個(gè)API密鑰,并安裝ClaudeCode即可開(kāi)始編程。
結(jié)語(yǔ):更多尺寸即將推出,探索編程智能體自我提升
在Cursor斷供Claude等適用于編程領(lǐng)域的模型之際,Qwen3-Coder的本次開(kāi)源給國(guó)內(nèi)開(kāi)發(fā)者提供了最新的替代選項(xiàng)。
Qwen團(tuán)隊(duì)透露,他們?nèi)栽谂μ岣逤odingAgent的性能,旨在讓它承擔(dān)軟件工程中復(fù)雜和乏味的任務(wù),從而釋放人類的生產(chǎn)力。
Qwen3-Coder的更多模型尺寸即將推出,可維持部署成本和性能之間的平衡。此外,該團(tuán)隊(duì)正在探索CodingAgent是否可以實(shí)現(xiàn)自我提升。
驚喜不斷的五本都市超能爆款小說(shuō),熱血沸騰
必看的TOP3都市超能好評(píng)小說(shuō)《極品醫(yī)神》 作者:風(fēng)臨天下內(nèi)容簡(jiǎn)介:掌握數(shù)億家財(cái),無(wú)上權(quán)勢(shì)又如何?我的手執(zhí)宰你的命運(yùn)_。(點(diǎn)擊下方免費(fèi)閱讀)《神醫(yī)至尊》 作者:明月長(zhǎng)劍內(nèi)容簡(jiǎn)介:世界上從來(lái)不缺乏金錢和女人,關(guān)鍵是如何運(yùn)用和享受|-。天才少年凌威為尋找千年靈芝跌落懸崖,揭開(kāi)一個(gè)古老醫(yī)學(xué)家族的面紗。五年好了吧!
書(shū)迷狂熱追捧的都市超能高口碑小說(shuō)合集,熬夜刷書(shū)必備
愛(ài)追《極品醫(yī)神》的你不能錯(cuò)過(guò)都市超能小說(shuō)推薦,一作封神《極品醫(yī)神》 作者:風(fēng)臨天下內(nèi)容簡(jiǎn)介:掌握數(shù)億家財(cái),無(wú)上權(quán)勢(shì)又如何?我的手執(zhí)宰你的命運(yùn)|——。(點(diǎn)擊下方免費(fèi)閱讀)《我有九個(gè)師娘貌美如花》 作者:麻辣香鍋內(nèi)容簡(jiǎn)介:師父病重,江凡為了滿足師父的心愿,前往豐都城找人——。初次來(lái)到豐都城的江凡,..
劇情跌宕起伏的網(wǎng)絡(luò)小說(shuō)《極品醫(yī)神》,真的讓人很愛(ài)!
(點(diǎn)擊下方免費(fèi)閱讀)《神醫(yī)無(wú)雙》 作者:天才魔術(shù)師內(nèi)容簡(jiǎn)介:實(shí)習(xí)醫(yī)生羅源意外獲得天醫(yī)傳承,卻陰差陽(yáng)錯(cuò)卷入各種爭(zhēng)斗,從此開(kāi)始一段小人物崛起奮斗不息的故事——。(點(diǎn)擊下方免費(fèi)閱讀)《極品醫(yī)神》 作者:風(fēng)臨天下內(nèi)容簡(jiǎn)介:掌握數(shù)億家財(cái),無(wú)上權(quán)勢(shì)又如何?我的手執(zhí)宰你的命運(yùn)。(點(diǎn)擊下方免費(fèi)閱讀)感謝大家的希望你能滿意。
來(lái)源:紅網(wǎng)
作者:貫靜珊
編輯:郭哲嘉
本文為紅辣椒評(píng)論 原創(chuàng)文章,僅系作者個(gè)人觀點(diǎn),不代表紅網(wǎng)立場(chǎng)。轉(zhuǎn)載請(qǐng)附原文出處鏈接和本聲明。