阿里巴巴通義團隊用四連發(fā)的重磅出擊,橫掃Github開源榜單。
本周從7月22日到25日,阿里接連推出Qwen3-235B非思考版本、Qwen3-Coder編程模型、Qwen3-235B-A22B-Thinking-2507推理模型,以及WebSailorAIAgent框架,四款產品橫掃基礎模型、編程模型、推理模型和智能體領域的開源榜單。
權威機構ArtificialAnalysis更是直接評價:
通義千問3是全球最智能的非思考基礎模型。非思考模型也能性能“爆表”
據硬AI,周二凌晨阿里巴巴通義千問團隊推出非思考模式(Non-thinking)最新模型,命名為Qwen3-235B-A22B-Instruct-2507-FP8。
這款非思考模型在多項關鍵基準測試中表現出色。不僅全面超越了Kimi-K2等頂級開源模型,甚至領先Claude-Opus4-Non-thinking等頂級閉源模型。
值得一提的是,本次更新的Qwen3模型在Agent能力尤其亮眼:在BFCL(Agent能力)測評中表現卓越。這意味著模型在理解復雜指令、自主規(guī)劃、調用工具以完成任務的能力上,達到了一個新的高度。“主打Agent”,將是未來AI應用的核心競爭力。
編程模型引發(fā)社區(qū)沸騰
7月23日發(fā)布的Qwen3-Coder更是在全球開發(fā)者社區(qū)引發(fā)轟動。
華爾街見聞此前提及,這款基于MoE架構的編程模型擁有480B總參數,35B激活參數,原生支持256K上下文,可擴展至1M。
在開發(fā)者最關注的SWE-benchVerified基準測試中,Qwen3-Coder取得了開源模型最佳表現。
模型在7.5萬億token規(guī)模上訓練,其中包含70%代碼數據,并通過長時程強化學習和2萬個虛擬環(huán)境的大規(guī)模實戰(zhàn)訓練,在真實世界的多輪交互任務中展現出色能力。
阿里還推出了配套的命令行工具QwenCode,為開發(fā)者提供了完整的編程解決方案。
科技界領袖紛紛為Qwen3-Coder點贊,例如PerplexityCEOAravindSrinivas盛贊Qwen3-coder的實力:
成果令人驚嘆,開源正在獲勝。
推特創(chuàng)始人JackDorsey更是強調Qwen3和Goose——其Block公司開發(fā)的AIAgent框架,搭配使用的話非常棒:
goose配合Qwen3-Coder等于哇哦
AIAgent框架挑戰(zhàn)閉源壟斷
阿里通義實驗室同期開源的WebSailorAIAgent框架,直接對標OpenAI的DeepResearch產品。
這款框架在BrowseComp-en/zh測試中性能顯著優(yōu)于所有開源智能體,可媲美專屬閉源模型。
WebSailor采用復雜任務生成和強化學習模塊的雙重技術架構。通過構建復雜知識圖譜和動態(tài)采樣策略,系統(tǒng)能夠在海量信息中進行高效檢索和推理。
除了在復雜任務上的卓越表現,WebSailor在簡單任務上也表現出色。例如,在SimpleQA基準測試中,WebSailor的性能超過了所有其他模型產品。
該項目在GitHub已獲得超過5000顆星,并曾拿下每日增長趨勢第一名。
WebSailor的核心技術主要圍繞復雜任務生成和強化學習模塊展開,這兩個模塊相互配合,共同推動了開源智能體在復雜信息檢索任務中的性能提升。
該框架的開源意義重大,打破了閉源系統(tǒng)在信息檢索領域的壟斷地位,為全球開發(fā)者提供了媲美DeepResearch的開源解決方案。
推理模型登頂全球開源冠軍
7月25日發(fā)布的Qwen3-235B-A22B-Thinking-2507成為本周最重磅的產品。
AIME25(數學)達到92.3分。LiveCodeBenchv6(編程)獲得74.1分。WritingBench(寫作)達到88.3分。PolyMATH(多語言數學)獲得60.1分。
更詳細的榜單表現來看,Qwen3推理模型相較于其他模型來看也毫不遜色(除了R1,其他都是頂尖閉源模型)。
該模型采用MoE架構,總參數235B,激活參數22B,擁有94層結構和128個專家系統(tǒng),原生支持262,144tokens上下文長度。模型專為思考模式構建,默認聊天模板自動包含思考標簽,為深度推理提供了強大支撐。
OpenRouter數據顯示,阿里千問的API調用量在過去幾天暴漲,已超過1000億tokens,包攬最熱門調用模型前三名。這一數據直接反映了市場對阿里開源模型的認可度。
全球網友也是被通義的最強推理模型給驚呆了。有網友直接表示:
中國的開源o4-mini。
AIThinkers更是評論道:
中國剛剛發(fā)布了一款怪物級的AI模型。
《修仙歸來當奶爸》短劇免費在線觀看全集完整版高清正片??喝茶影院
《修仙歸來當奶爸》電視劇免費在線觀看全集_完整版??定格網...
正在播放《修仙歸來當奶爸》全集高清全集免費在線觀看??風車影視
免責聲明:本文內容由開放的智能模型自動生成,僅供參考。