7月25日,阿里巴巴全新開源千問3推理模型,性能大幅提升,一舉奪下「全球最強開源模型」王座,比肩頂級閉源模型Gemini-2.5pro、o4-mini。本周阿里已連續(xù)開源3款重磅模型,分別斬獲基礎(chǔ)模型、編程模型、推理模型等主流領(lǐng)域的三項全球開源冠軍。兩天前開源的AI編程模型Qwen3-Coder,更是引爆全球AI圈,掀起一波用中國千問開源模型替代閉源模型的新浪潮。
最新推出的千問3推理模型,登頂全球最強開源推理模型。自千問3旗艦?zāi)P蚎wen3-235B-A22B發(fā)布后,阿里通義團隊一直在擴展大模型的推理極限,全新開源的千問3推理模型在通用能力和深度思考能力上實現(xiàn)巨大飛躍。千問3推理模型支持256K上下文長度,在知識(SuperGPQA)、編程(LiveCodeBenchv6)、數(shù)學(xué)(AIME25)、人類偏好對齊(Arena-Hardv2)、創(chuàng)意寫作(WritingBench)、多語言能力(MultilF)等核心能力上,千問3推理模型完全可比肩Gemini-2.5pro、o4-mini等頂尖閉源模型,并創(chuàng)下全球開源模型的最佳性能表現(xiàn)。
在經(jīng)典基礎(chǔ)模型領(lǐng)域,千問3全球最強。3天前開源的Qwen3-235B-A22B-Instruct-2507(非思考版)新模型,性能顯著提升,在GPQA(知識)、AIME25(數(shù)學(xué))、LiveCodeBench(編程)、Arena-Hard(人類偏好對齊)、BFCL(Agent能力)等眾多測評中表現(xiàn)出色,超越Claude4(Non-thinking)等領(lǐng)先閉源模型。權(quán)威AI研究機構(gòu)ArtificialAnalysis指出,“千問3是全球最智能的非思考基礎(chǔ)模型”。
在AI編程領(lǐng)域,新開源的Qwen3-Coder被譽為「全球最好的編程模型」。Qwen3-Coder在代碼能力及Agent調(diào)用能力方面取得重大突破。在多語言SWE-bench、Mind2Web、Aider-Polyglot等模型Agent能力評估中,Qwen3-Coder超越GPT4.1、Claude4等頂級閉源模型,并登頂全球最大AI開源社區(qū)HuggingFace模型總榜冠軍。借助Qwen3-Coder,剛?cè)胄械某绦騿T一天就能完成資深程序員一周的工作,生成一個品牌官網(wǎng)最快只需5分鐘。
Qwen3-Coder的開源,引爆硅谷科技圈,在全球AI圈掀起一波「AI編程」熱潮。推特創(chuàng)始人杰克·多爾西(JackDorsey)、爆火Agent應(yīng)用PerplexityCEO阿拉溫德·斯里尼瓦斯(AravindSrinivas)、著名風(fēng)投公司a16z合伙人馬克·馬斯克羅(MarcoMascorro)等硅谷大咖盛贊Qwen3-Coder,HuggingFaceCEO克萊門特·德朗格(ClementDelangue)更是連轉(zhuǎn)帶發(fā)12條推文,向全球開發(fā)者力薦這一最好的編程模型。海外知名模型API聚合平臺OpenRouter數(shù)據(jù)顯示,阿里千問API調(diào)用量暴漲,過去幾天已突破1000億Tokens,在OpenRouter趨勢榜上包攬全球前三,是當(dāng)下最熱門的模型。
截至目前,阿里巴巴已開源300余款通義大模型,通義千問衍生模型突破14萬個,超越Meta的Llama系列成為全球第一的開源模型家族,通義也是開發(fā)者和企業(yè)使用最廣泛的大模型。未來三年,阿里巴巴還將投入超過3800億元用于建設(shè)云和AI硬件基礎(chǔ)設(shè)施,持續(xù)升級全棧AI能力,為中國和全球開發(fā)者和企業(yè)提供更先進的模型和云計算服務(wù)。
十本腦洞大開的高分網(wǎng)文小說
盤點十七本八月份下半月完本的高質(zhì)量小說,書荒的讀者不要錯過!
盤點十五本不容錯過的高品質(zhì)連載小說,烈推強薦書荒的書友追讀!
免責(zé)聲明:本文內(nèi)容由開放的智能模型自動生成,僅供參考。