當(dāng)代碼擁有靈魂,或許才是一場靜默革命的開始。
作者|張勇毅
編輯|鄭玄
如果你是已經(jīng)接觸過VibeCoding類產(chǎn)品的用戶,或許已經(jīng)熟悉這類產(chǎn)品作為「副駕駛」的屬性:它們往往就如同一位盡職的副駕駛。在你長途奔襲時,它能幫你盯著儀表盤,甚至在你打盹的間隙,幫你扶穩(wěn)方向盤,補全下一行代碼,或是直接幫你生成某個功能。
但過去很長時間中,這類產(chǎn)品更多還只能是「副駕」,它執(zhí)行的是用戶給出的任務(wù)清單,是對指令的被動響應(yīng)。它難以或者完全無法理解用戶為何要選擇這條路,更不明白開發(fā)者想要傳達的、心中真正的目的地在何方。
但如果,AI不再滿足于副駕的角色呢?如果它能讀懂你的導(dǎo)航意圖,能預(yù)判前方的路況,甚至能在你給出目的地后,獨立規(guī)劃并跑完全程呢?它才真正有了能成為一位真正的「全棧工程師」的可能。
今天,我深度體驗了阿里剛開源的Qwen3-Coder:阿里云甚至官方直接在簡介中,表明這就是目前代碼能力達到開源模型SOTA的存在。
根據(jù)海外知名模型API聚合平臺OpenRouter數(shù)據(jù)顯示,阿里千問API調(diào)用量暴漲,過去幾天已突破1000億Tokens,在OpenRouter趨勢榜上包攬全球前三,是當(dāng)下最熱門的模型。
包括Qwen3-Coder在內(nèi),本周阿里已連續(xù)開源3款重磅模型,分別斬獲基礎(chǔ)模型、編程模型、推理模型等主流領(lǐng)域的三項全球開源冠軍;其中千問3推理模型在創(chuàng)意寫作、數(shù)學(xué)、多語言的概念領(lǐng)域的能力,已經(jīng)完全可比肩Gemini-2.5pro、o4-mini等頂尖閉源模型,并創(chuàng)下全球開源模型的最佳性能表現(xiàn)。
說實話,即使Qwen3-Coder已經(jīng)被譽為「全球最好的編程模型」,登頂全球最大AI開源社區(qū)HuggingFace模型總榜冠軍的寶座,在打開它之前,我內(nèi)心只是抱著「又一個國產(chǎn)模型」的、略帶審慎的期待。
然而,在經(jīng)過了一天的測試與深度對話之后,這個號稱達到目前SOTA水準(zhǔn)的新模型,真的給我?guī)砹岁P(guān)于VibeCoding不一樣的體驗。
01
能創(chuàng)造數(shù)字空間的編程模型
我的Qwen3-Coder「初體驗」,是從一系列過去我已知很難或完全無法完成的測試開始的。
我決定先用一個經(jīng)典的「AI設(shè)計品味照妖鏡」來試探它。我輸入了一段幾乎可以說是任性的指令:
「給我創(chuàng)建一個極客公園作為科技新聞媒體的官網(wǎng)首頁,要有現(xiàn)代感的導(dǎo)航欄、吸引眼球的配色、簡潔的公司介紹、清晰的內(nèi)容欄,以及一個完整的頁腳?!?/p>
在我對Grok、ChatGPT乃至Gemini類似產(chǎn)品的體驗中,類似的請求往往會收獲一個停留在上世紀(jì)90年代審美的災(zāi)難現(xiàn)場:布局混亂、配色辣眼,仿佛是對現(xiàn)代設(shè)計美學(xué)的一場公開處刑。
說實話,在正式的結(jié)果返回之前,我?guī)缀跻呀?jīng)做好了心理準(zhǔn)備,去迎接一個需要我從頭開始重構(gòu)的、布滿
標(biāo)簽的混亂骨架。
然而,當(dāng)代碼生成完畢,并在預(yù)覽中渲染出頁面的那一刻,呈現(xiàn)在我眼前的,是一個設(shè)計語言高度統(tǒng)一、采用響應(yīng)式布局、甚至還有界面動畫效果的完整頁面。
Qwen3-Coder生成的極客公園網(wǎng)站首頁|圖片來源:極客公園
如果說第一次的驚艷還停留在視覺層面,那么接下來的測試,則開始觸及它更深層次的「靈魂」。
我向它提出了一個更抽象的挑戰(zhàn):
「創(chuàng)建一個基于物理引擎的音樂生成器,使用Matter.js,讓不同形狀的物體在畫布中自由下落,當(dāng)它們相互碰撞時,能根據(jù)形狀發(fā)出不同音階的音符,并且,我需要一個『重力控制器』來實時改變它們的下落軌跡?!?/p>
這個任務(wù)的難點,在于它要求AI不僅要理解代碼,更要理解代碼背后的世界。
代碼是理性的,但物理的律動和音樂的和諧,卻帶有一絲感性的溫度。Qwen3-Coder的表現(xiàn)再次超出了我的預(yù)期。它實現(xiàn)了所有功能——你能看到小球、方塊在畫布中落下,每一次碰撞都奏出和弦。
當(dāng)你拖動重力控制器,所有物體的運動軌跡隨之改變,原本舒緩的旋律瞬間變得急促,在你的屏幕上演奏著無序的樂章。它不僅完成了功能,甚至帶來了意想不到的藝術(shù)美感。
為了進一步探尋它的邊界,我又拋出了一個生成游戲的命題,讓它生成一個完全由鍵盤控制的3D射擊游戲。同時有著多個可交互對象,甚至有一個簡單的「通關(guān)劇情」以及「彩蛋」,如果你能發(fā)現(xiàn)我留在代碼中的彩蛋信息,即可迅速通關(guān)。
從生成的結(jié)果上來看,Qwen3-Coder返回的結(jié)果同時包括了對目標(biāo)重力加速度的計算,以及碰撞檢測算法,乃至最讓我驚喜的部分——生成一個3D箱庭世界、同時對向量投影、距離檢測的檢測算法,都在這個小小的游戲中得到準(zhǔn)確的實現(xiàn)。
在物理模擬能力這塊,當(dāng)然也少不了經(jīng)典的小球彈跳游戲,Qwen3-Coder還是能夠輕松復(fù)現(xiàn)。
除了這些實際案例的結(jié)果,在測試中還有一個維度的體驗,不得不單獨拿出來談?wù)?,那就是它的生成速度余長任務(wù)上下文記憶能力。
在我的實際測試中,超過十個不同的開發(fā)用例,幾乎都在1-3分鐘內(nèi)得以解決。
900余行的代碼僅需要三分鐘的時間即可生成,這大大加快的代碼的迭代速度|圖片來源:極客公園
這種返回效率,帶來的是一種相比此前代碼生成模型更流暢的創(chuàng)作心流,開發(fā)者得以將想法快速轉(zhuǎn)化為現(xiàn)實,我可以迅速根據(jù)生成的結(jié)果、快速微調(diào)迭代代碼版本,而不用在漫長的等待中中斷思緒。
如今,行業(yè)里每個人都在討論「VibeCoding」(氛圍編程)。Vibe固然是人機交互的未來所向,它關(guān)乎直覺與靈感。但我們或許也應(yīng)該意識到,支撐起所有暢快「Vibe」的,終究是那不打折扣的,堅實可靠的「Coding」硬實力。
02
世界級的編程模型,是怎么煉成的?
Qwen3-Coder之所以能從一個「代碼補全器」,進化為一個「自主開發(fā)者」,首先是它架構(gòu)的選擇——混合專家(MoE)帶來的規(guī)模與效率。
傳統(tǒng)的巨大模型像一個知識淵博但全科的教授,雖然什么都懂,但在處理特定專業(yè)問題時,仍需耗費大量精力。而Qwen3-Coder「超大杯」版本,則像一個擁有4800億龐大知識儲備的「智囊團」,內(nèi)部卻劃分了無數(shù)個高度專業(yè)的「領(lǐng)域?qū)<摇埂?/p>
當(dāng)你提出一個問題,系統(tǒng)并不會調(diào)用整個模型數(shù)據(jù),而只會激活與該問題最相關(guān)的350億參數(shù)的「專家小組」進行響應(yīng)。這種設(shè)計,讓它在擁有巨大知識容量和能力天花板的同時,又將單次推理的計算成本控制在了極為合理的范圍內(nèi)。這是一種在模型能力和推理效率之間取得的精妙平衡,也是它能處理復(fù)雜問題的關(guān)鍵基礎(chǔ)。
除此之外,阿里Qwen團隊認為,編程任務(wù)「天然適合執(zhí)行驅(qū)動的強化學(xué)習(xí)」,因為代碼的正確性,可以通過實際運行結(jié)果這個最客觀的標(biāo)準(zhǔn)來直接驗證?;诖?,他們構(gòu)建了一個能夠并行運行兩萬個獨立環(huán)境的大規(guī)模強化學(xué)習(xí)基礎(chǔ)設(shè)施。
你可以把它想象成一個擁有兩萬名「數(shù)字實習(xí)生」的軟件公司。在這里,模型可以海量地模擬真實的軟件工程流程:接收一個模糊的任務(wù),自主地進行規(guī)劃和方案分解,然后調(diào)用外部工具(如代碼執(zhí)行器、測試框架)去嘗試,并從環(huán)境的反饋(成功、失敗、或是具體的錯誤信息)中學(xué)習(xí),最后根據(jù)反饋進行迭代和自我修正。
正是通過在這種大規(guī)模、高并發(fā)的真實編碼環(huán)境中進行的海量試錯和學(xué)習(xí),Qwen3-Coder才成功地學(xué)會了如何解決那些需要自主規(guī)劃和工具調(diào)用的「長視距」任務(wù),它的代碼執(zhí)行成功率和工具使用效率也因此得到了顯著提升。
最后也是到目前為止,讓我覺得Qwen3-Coder體驗不同于以往代碼生成模型的關(guān)鍵所在,也是Qwen3-Coder自我糾錯能力與理解力的基石——處理大規(guī)模代碼庫的「倉庫級」上下文長度。
軟件工程的復(fù)雜性,往往源于對龐大代碼庫的理解。Qwen3-Coder在這方面具備了物理層面的絕對優(yōu)勢:它原生支持256Ktokens的上下文窗口。這意味著什么?這意味著模型可以在一次交互中,處理數(shù)百萬字符的代碼和文檔。
如果說MoE架構(gòu)賦予了模型智慧的「潛力」,強化學(xué)習(xí)賦予了它解決問題的「技巧」,那么超長上下文窗口則為它提供了施展才華的「舞臺和物料」。沒有對整個系統(tǒng)全局的視野,再聰明的模型也只是一個「管中窺豹」的計算器。正是憑借這一能力,Qwen3-Coder才真正將任務(wù)的性質(zhì)從「生成一段有效的代碼片段」提升到了「對一個復(fù)雜的軟件系統(tǒng)執(zhí)行一次有效的操作」。
這種處理「倉庫級」代碼的能力,是解決復(fù)雜系統(tǒng)級問題、進行大規(guī)模代碼重構(gòu)和深入理解遺留系統(tǒng)的先決條件,也是許多上下文窗口較小的模型所望塵莫及的。
在衡量代碼模型解決真實世界軟件問題的權(quán)威榜單SWE-Bench上,Qwen3-Coder的得分實現(xiàn)了對OpenAI最強閉源模型之一GPT-4.1的明確超越。這意味著,在處理那些復(fù)雜、真實的編程任務(wù)時,這個來自中國的開源模型,展現(xiàn)出了更強的效能。
而在AgenticCoding這個以智能體能力為核心的賽道上,Qwen3-Coder更是可以和一直以來的標(biāo)桿Claude4平起平坐。
目前,如果想上手Qwen3-Coder的話,最直接的方式莫過于訪問chat.qwen.ai。在頁面的右上角可以一鍵切換模型。
如果你想要追求目前極致的「意圖優(yōu)先」代碼體驗,或者你已經(jīng)是VibeCoding老手,你還可以自己嘗試「超大杯」,以API的方式,在各種CLI中調(diào)用Qwen3-Coder-480B-A35B-Instruct。
這是一個480B參數(shù)激活35B參數(shù)的MoE模型,原生支持256Ktoken的上下文,并可通過YaRN擴展到1Mtoken。只需前往阿里云注冊賬戶,完成簡單的認證,便能創(chuàng)建屬于你的API-Key調(diào)用這個模型。
得益于其對OpenAIAPI格式的完美兼容,你可以將這個API-Key無縫集成到你所熟悉的各類Chat或Coding工具中,無論是Cursor、Trae、CodeBuddy還是Cline。
并且它比Claude便宜。在阿里云百煉上,Qwen3-CoderAPI每百萬Tokens最低輸入和輸出價格分別為4元和16元,平均價格為Claude4的1/3。同時,阿里云百煉還推出了低至5折的限時優(yōu)惠,128K-1M長上下文價格享受五折優(yōu)惠。
而對于那些將數(shù)據(jù)主權(quán)和隱私安全置于首位的用戶,Qwen3-Coder則提供了最徹底的解決方案——本地化部署。
你可以直接從HuggingFace或國內(nèi)的魔搭社區(qū)下載完整的模型文件。這意味著,你可以將這個目前最強大的編程開源工具,完全私有化運行在自己的服務(wù)器上。
03
本土選擇的世界意義
寫到這里,關(guān)于Qwen3-Coder的結(jié)論已經(jīng)呼之欲出:它的出現(xiàn),不是為了取代誰,而是為了武裝誰。它將一個資深開發(fā)團隊的綜合能力,壓縮進一個任何人都可以調(diào)用的工具里,然后交到你的手上。
過去很長一段時間,當(dāng)我們討論起頂尖的編碼大模型時,國內(nèi)開發(fā)者的選擇似乎總是捉襟見肘。這背后反映了一個關(guān)鍵事實:在自然語言處理領(lǐng)域,中文語料的積累能為國產(chǎn)模型帶來「主場優(yōu)勢」;但在編程領(lǐng)域,代碼是世界的通用語言。無論是Python、Java還是JavaScript,其語法和邏輯在全球都是統(tǒng)一的。
這意味著,編碼能力的競爭是在一個完全公平的全球化賽場上進行的。在這條賽道上,不存在語言壁壘,只有赤裸裸的技術(shù)實力比拼。
Qwen3-Coder在SWE-Bench等國際公認的基準(zhǔn)上取得領(lǐng)先,其意義遠超于在某個中文榜單上登頂。它標(biāo)志著中國自研的AI模型,在技術(shù)硬實力上,已經(jīng)具備了在全球最前沿、競爭最激烈的領(lǐng)域中一較高下的能力。
如果說開源是一種態(tài)度,那么從目前Qwen3-Coder展現(xiàn)出的能力上,似乎可以相信通義千問的決心與魄力。
價格方面,阿里不僅直接選擇了開源免費,其API的調(diào)用成本也遠低于海外的同級模型。
更重要的是,這是一款來自中國的開源模型——僅這一點,對中國用戶來講就意味著能隨時、穩(wěn)定地調(diào)用,擺脫了對網(wǎng)絡(luò)環(huán)境、供應(yīng)限制與訪問速度的擔(dān)憂。
它或許并非是唯一的選項,但很高興看到,在編碼大模型這條賽道上,國內(nèi)的開發(fā)者們終于迎來了那個可靠、親切,且足夠好用的本土選手。
*頭圖來源:Qwen3Coder
本文為極客公園原創(chuàng)文章,轉(zhuǎn)載請聯(lián)系極客君微信geekparkGO
極客一問
你如何看待Qwen3Coder?
WAIC前線!實拍宇樹機器人VS人類,這機器人怎么還會碰瓷呢!
點贊關(guān)注極客公園視頻號,
三千年前 仙帝重生 持奪寶系統(tǒng), 縱橫天地, 橫掃六合八荒。 天上天下, 唯我獨尊