今天,阿里正式發(fā)布Qwen3-Coder,這是阿里迄今為止最具代理能力的代碼模型。
Qwen3-Coder擁有多個尺寸,其中當(dāng)前最強大的版本為Qwen3-Coder-480B-A35B-Instruct。這是一個480B參數(shù)激活35B參數(shù)的MoE模型,原生支持256Ktoken的上下文并可通過YaRN擴展到1Mtoken,擁有卓越的代碼和Agent能力。
Qwen3-Coder-480B-A35B-Instruct在AgenticCoding、AgenticBrowser-Use和AgenticTool-Use上取得了開源模型的SOTA效果,可以與ClaudeSonnet4媲美
據(jù)阿里官方介紹,借助Qwen3-Coder,剛?cè)胄械某绦騿T一天就能完成資深程序員一周的工作,生成一個品牌官網(wǎng)最快只需5分鐘。
與此同時,阿里還推出并開源了一款用于代理式編程的命令行工具:QwenCode。
QwenCode基于GeminiCode進行二次開發(fā),但阿里進行了prompt和工具調(diào)用協(xié)議適配,使得QwenCode可以最大程度激發(fā)Qwen3-Coder在AgenticCoding任務(wù)上的表現(xiàn)。
另外,Qwen3-Coder可以和社區(qū)優(yōu)秀的編程工具結(jié)合,如ClaudeCode、Cline等。這一模型已在阿里云旗下大模型服務(wù)平臺百煉上線,其API采用了階梯計費的方式,根據(jù)輸入token量調(diào)整價格。
在256K~1M一檔,其輸入價格為6美元/百萬token,輸出價格為60美元/百萬token。相比之下,ClaudeSonnet4的輸入輸出價格分別為3美元/百萬token、15美元/百萬token,與Qwen3-Coder128k~256k一檔的價格持平。
Qwen3-Code的大規(guī)模強化學(xué)習(xí)
這次阿里從不同角度對Qwen3-Coder進行Scaling,以提升模型的代碼能力:
數(shù)據(jù)擴展:總計7.5T(代碼占比70%),在保持通用與數(shù)學(xué)能力的同時,具備卓越的編程能力;上下文擴展:原生支持256K上下文,借助YaRN可拓展至1M,專為倉庫級和動態(tài)數(shù)據(jù)(如PullRequest)優(yōu)化,助力AgenticCoding;合成數(shù)據(jù)擴展:利用Qwen2.5-Coder對低質(zhì)數(shù)據(jù)進行清洗與重寫,顯著提升整體數(shù)據(jù)質(zhì)量。
此外,與當(dāng)前社區(qū)普遍聚焦于競賽類代碼生成不同,阿里認為所有的代碼任務(wù)天然適合執(zhí)行驅(qū)動的大規(guī)模強化學(xué)習(xí)。因此阿里選擇在更豐富的真實代碼任務(wù)上擴展CodeRL訓(xùn)練。
通過自動擴展測試樣例,阿里構(gòu)造了大量高質(zhì)量的訓(xùn)練實例,成功釋放了強化學(xué)習(xí)的潛力:不僅顯著提升了代碼執(zhí)行成功率,還對其他任務(wù)帶來增益。
在Long-HorizonRL階段,模型學(xué)會了在真實軟件工程環(huán)境中進行多輪交互——規(guī)劃、執(zhí)行、接受反饋、再決策。阿里在Qwen3-Coder的后訓(xùn)練階段執(zhí)行了AgentRL,鼓勵模型通過多輪交互的方式利用工具解決問題。
而AgentRL的主要挑戰(zhàn)在于EnvironmentScaling,阿里實現(xiàn)了可驗證環(huán)境的擴展系統(tǒng),借助阿里云的基礎(chǔ)設(shè)施,實現(xiàn)同時運行20k獨立環(huán)境。這一套基礎(chǔ)設(shè)施可以提供大規(guī)模的強化學(xué)習(xí)反饋和評測,最終阿里在SWE-benchVerified上實現(xiàn)了開源模型SOTA的效果。
Qwen3-Coder的生態(tài)集成
Qwen3-Coder推出多元化的使用方案,降低開發(fā)者接入門檻。自研的QwenCode工具基于GeminiCode進行優(yōu)化,通過prompt和工具調(diào)用協(xié)議適配,最大化激發(fā)模型在代理式編程任務(wù)上的表現(xiàn)。
該模型同時支持與ClaudeCode的集成使用,開發(fā)者可通過阿里云百煉平臺申請API密鑰,采用兩種接入方案實現(xiàn)無縫對接。此外,Qwen3-Coder還兼容Cline等主流編程工具。
通過百煉API平臺,開發(fā)者可直接調(diào)用該模型服務(wù),阿里云提供了完整的示例代碼和配置指南,支持快速部署和測試:
QwenCode是一個CLI工具,修改自GeminiCLI,針對Qwen3?Coder系列的模型增強了解析器和工具支持。step1:安裝QwenCode確保已安裝Node.js20及以上版本,可以通過以下命令安裝:step2:通過npm管理器安裝QwenCode從npm包安裝:從源碼安裝:step3:配置環(huán)境變量(使用OpenAISDK調(diào)用LLM)QwenCode支持OpenAISDK調(diào)用LLM,你可以導(dǎo)出以下環(huán)境變量,或者簡單地將其放在.envfile中。
除了Qwen?Code之外,現(xiàn)在還可以將Qwen3?Coder與Claude?Code搭配使用。只需在阿里云百煉平臺申請?API?Key,并安裝?Claude?Code,即可開始暢享編碼體驗。阿里提供了兩種接入方式,幫助無縫地用Qwen3?Coder進行編碼:
方案?1:使用dashscope提供的代理?API只需要將Anthropic的baseurl替換成dashscope上提供的endpoint即可。至此就可以直接輸入claude開始使用Qwen3-Coder&ClaudeCode方案?2:使用claude-code-config自定義路由claude-code-router是一個第三方的路由工具,用于為?Claude?Code?靈活地切換不同的后端API。dashscope平臺提供了一個簡單的擴展包claude-code-config,可為claude-code-router生成包含dashscope支持的默認配置。生成配置文件和插件目錄:該命令會自動生成ccr所需的配置文件和插件目錄。你也可以手動調(diào)整~/.claude-code-router/config.json和~/.claude-code-router/plugins/中的配置。最后,通過ccr開始使用ClaudeCode:
至此即可通過ccr使用Claude?Code暢享Qwen3?Coder的強大編碼能力。而如果開發(fā)者想通過百煉API平臺,可接調(diào)用該模型服務(wù),阿里云也提供了完整的示例代碼和配置指南,支持快速部署和測試:
Demo示例
正式發(fā)布時,Qwen官方也提供了Qwen3-Coder的部分用例。
例如,可以讓其打造一個基于物理的煙囪拆除模擬,按照實際需求受控爆炸。
還有網(wǎng)友讓Qwen3-Coder出了一道3DHTML開發(fā)題,內(nèi)容是創(chuàng)建一個3D旋轉(zhuǎn)的立方體展示臺,六個面顯示不同顏色,自動旋轉(zhuǎn),添加光照效果和陰影等。
Qwen3-Coder交付的結(jié)果完成度不錯,基本實現(xiàn)了主要功能,旋轉(zhuǎn)動效、陰影等處理到位。
市場前景:瞄準(zhǔn)編程AI助手增長空間
阿里云表示將繼續(xù)提升CodingAgent效果,希望承擔(dān)更多復(fù)雜軟件工程任務(wù),釋放開發(fā)者生產(chǎn)力。公司計劃推出更多模型尺寸版本,在保證效果的同時降低部署成本。
該公司正積極探索CodingAgent的自我改進能力,這一技術(shù)方向被視為編程AI發(fā)展的關(guān)鍵突破點。隨著企業(yè)對自動化編程需求的增長,代碼生成模型市場預(yù)期將迎來快速擴張。
Qwen3-Coder的發(fā)布時機正值全球科技公司加速布局AI編程助手,該產(chǎn)品的開源策略和多工具兼容性有望在激烈的市場競爭中獲得差異化優(yōu)勢。
三本高人氣都市超能熱追好文傾情巨獻,一口氣看完超過癮
小說:穿越成老頭子還斗破?老翁我逆襲,妹子來追!
中華百善全書系列:《靈語現(xiàn)真》