7月25日,阿里巴巴全新開源千問3推理模型,性能大幅提升,一舉奪下「全球最強開源模型」王座,比肩頂級閉源模型Gemini-2.5pro、o4-mini。本周阿里已連續(xù)開源3款重磅模型,分別斬獲基礎模型、編程模型、推理模型等主流領域的三項全球開源冠軍。兩天前開源的AI編程模型Qwen3-Coder,更是引爆全球AI圈,掀起一波用中國千問開源模型替代閉源模型的新浪潮。
最新推出的千問3推理模型,登頂全球最強開源推理模型。自千問3旗艦模型Qwen3-235B-A22B發(fā)布后,阿里通義團隊一直在擴展大模型的推理極限,全新開源的千問3推理模型在通用能力和深度思考能力上實現巨大飛躍。千問3推理模型支持256K上下文長度,在知識(SuperGPQA)、編程(LiveCodeBenchv6)、數學(AIME25)、人類偏好對齊(Arena-Hardv2)、創(chuàng)意寫作(WritingBench)、多語言能力(MultilF)等核心能力上,千問3推理模型完全可比肩Gemini-2.5pro、o4-mini等頂尖閉源模型,并創(chuàng)下全球開源模型的最佳性能表現。
在經典基礎模型領域,千問3全球最強。3天前開源的Qwen3-235B-A22B-Instruct-2507(非思考版)新模型,性能顯著提升,在GPQA(知識)、AIME25(數學)、LiveCodeBench(編程)、Arena-Hard(人類偏好對齊)、BFCL(Agent能力)等眾多測評中表現出色,超越Claude4(Non-thinking)等領先閉源模型。權威AI研究機構ArtificialAnalysis指出,“千問3是全球最智能的非思考基礎模型”。
在AI編程領域,新開源的Qwen3-Coder被譽為「全球最好的編程模型」。Qwen3-Coder在代碼能力及Agent調用能力方面取得重大突破。在多語言SWE-bench、Mind2Web、Aider-Polyglot等模型Agent能力評估中,Qwen3-Coder超越GPT4.1、Claude4等頂級閉源模型,并登頂全球最大AI開源社區(qū)HuggingFace模型總榜冠軍。借助Qwen3-Coder,剛入行的程序員一天就能完成資深程序員一周的工作,生成一個品牌官網最快只需5分鐘。
Qwen3-Coder的開源,引爆硅谷科技圈,在全球AI圈掀起一波「AI編程」熱潮。推特創(chuàng)始人杰克·多爾西(JackDorsey)、爆火Agent應用PerplexityCEO阿拉溫德·斯里尼瓦斯(AravindSrinivas)、著名風投公司a16z合伙人馬克·馬斯克羅(MarcoMascorro)等硅谷大咖盛贊Qwen3-Coder,HuggingFaceCEO克萊門特·德朗格(ClementDelangue)更是連轉帶發(fā)12條推文,向全球開發(fā)者力薦這一最好的編程模型。海外知名模型API聚合平臺OpenRouter數據顯示,阿里千問API調用量暴漲,過去幾天已突破1000億Tokens,在OpenRouter趨勢榜上包攬全球前三,是當下最熱門的模型。
截至目前,阿里巴巴已開源300余款通義大模型,通義千問衍生模型突破14萬個,超越Meta的Llama系列成為全球第一的開源模型家族,通義也是開發(fā)者和企業(yè)使用最廣泛的大模型。未來三年,阿里巴巴還將投入超過3800億元用于建設云和AI硬件基礎設施,持續(xù)升級全棧AI能力,為中國和全球開發(fā)者和企業(yè)提供更先進的模型和云計算服務。
免責聲明:本文內容由開放的智能模型自動生成,僅供參考。