中國開源大模型“屠榜”國際榜單,在業(yè)內(nèi)引發(fā)震動(dòng)。
7月31日,據(jù)國際開源社區(qū)Hugging-Face最新趨勢(shì)熱榜顯示,前十名模型中,有9個(gè)是國產(chǎn)大模型,其中排名第一的是智譜最新發(fā)布的新一代旗艦大模型GLM-4.5,排名第二的是阿里旗下通義千問模型Qwen3,而騰訊混元最新發(fā)布的3D模型則排行第三。
國際開源社區(qū)Hugging-Face榜單
在榜單的前十位中,5個(gè)隸屬于阿里通義千問旗下大模型,被戲稱為“開源世界半壁江山”。僅有一席不屬于國產(chǎn)大模型,隸屬于亞馬遜云科技(AWS)“參數(shù)服務(wù)器之父”AlexSmol和其學(xué)生李沐創(chuàng)辦的人工智能公司Boson.ai。
值得注意的是,年初火爆全網(wǎng)的大模型DeepSeek在Hugging-Face趨勢(shì)熱榜中并不靠前,不過其依然是目前點(diǎn)贊最多的大模型,DeepSeekR1收到了1.25萬個(gè)贊(like),遠(yuǎn)超其他國產(chǎn)大模型。
以目前排名第一的大模型智譜為例,據(jù)智譜方面披露,GLM-4.5參數(shù)量為DeepSeek-R1的二分之一、Kimi-K2的三分之一,但在多項(xiàng)標(biāo)準(zhǔn)基準(zhǔn)測(cè)試中表現(xiàn)得更好。
在性能優(yōu)化之外,GLM-4.5系列也在成本和效率上實(shí)現(xiàn)突破:API調(diào)用價(jià)格低至輸入價(jià)格為0.8元/百萬tokens,輸出價(jià)格2元/百萬tokens,大幅低于目前主流的模型定價(jià)。
智譜CEO張鵬向澎湃新聞?dòng)浾弑硎?,現(xiàn)有模型仍然算不上真正的通用模型,有些擅長(zhǎng)編程,有些精于數(shù)學(xué),有些在推理方面表現(xiàn)出色,但沒有一個(gè)能在所有任務(wù)上都達(dá)到最佳表現(xiàn)。GLM-4.5正是朝著統(tǒng)一各種能力這一目標(biāo)努力,力求在一個(gè)模型中集成所有這些不同的能力。大模型的下一個(gè)范式,一定是把各種能力整合到一起,成為一個(gè)“全優(yōu)生”。
在智譜演示的模型原生Agent場(chǎng)景中,GLM-4.5做出了能搜索的搜索引擎、能發(fā)彈幕的B站、能發(fā)博的微博。此外,GLM-4.5系列還能勝任全棧開發(fā)任務(wù),編寫復(fù)雜應(yīng)用、游戲、交互網(wǎng)頁。
值得注意的是,智譜旗下開源大模型的更新,只是近期國內(nèi)AI公司不斷沖刺的縮影。
7月27日,騰訊發(fā)布混元3D世界模型1.0,并宣布全面開源。這是業(yè)界首個(gè)開源可沉浸漫游、可交互、可仿真的世界生成模型,為游戲開發(fā)、VR、數(shù)字內(nèi)容創(chuàng)作等領(lǐng)域帶來了全新的可能性。
阿里通義千問近日宣布推出Qwen3-30B-A3B模型的全新版本,命名為Qwen3-30B-A3B-Instruct-2507。這一非思考模式的最新模型在技術(shù)架構(gòu)上實(shí)現(xiàn)重要突破,長(zhǎng)文本理解能力顯著提升至256K規(guī)模。
該模型采用創(chuàng)新的參數(shù)激活策略,只需激活3B參數(shù)即可達(dá)到與Gemini2.5-Flash和GPT-4o等主流閉源模型相當(dāng)?shù)男阅芩?。新版本在多?xiàng)核心基準(zhǔn)測(cè)試中表現(xiàn)突出,數(shù)學(xué)推理測(cè)試中AIME25得分達(dá)到61.3,代碼生成能力在LiveCodeBenchv6測(cè)試中獲得43.2分。
月之暗面也在7月底發(fā)布開源大模型KimiK2,引發(fā)全球關(guān)注。上線一周后,國際權(quán)威大模型排行榜LMArena宣布,這一模型接棒DeepSeek、登頂全球開源模型榜單,并在開閉源總榜上排名第五。據(jù)了解,KimiK2在多項(xiàng)基準(zhǔn)性能測(cè)試中取得優(yōu)異表現(xiàn),展現(xiàn)出在自主編程、智能體工具調(diào)用和數(shù)學(xué)推理等方面的領(lǐng)先能力。
中國開源大模型實(shí)力已經(jīng)引起全球震動(dòng),據(jù)外媒報(bào)道,中國企業(yè)正在研發(fā)的人工智能模型不僅智能化水平提升,使用成本也持續(xù)降低,這與深度求索(DeepSeek)當(dāng)年震動(dòng)市場(chǎng)的突破核心優(yōu)勢(shì)相呼應(yīng)。
有業(yè)內(nèi)人士分析認(rèn)為,全球AI大模型現(xiàn)已分為以中國模型為代表的開源派,與美國模型為代表的閉源派。近期,DeepSeek(深度求索旗下)、Qwen(阿里旗下)、Kimi(月之暗面旗下)、GLM(智譜旗下)等國產(chǎn)模型相繼開源,有網(wǎng)友稱為中國AI“開源四杰”,與國際上的GPT、Claude、Gemini、Grok組成的“閉源四強(qiáng)”成為競(jìng)爭(zhēng)對(duì)手。
長(zhǎng)期關(guān)注和投入大模型研發(fā)的昆侖萬維CEO方漢向澎湃新聞?dòng)浾咴u(píng)論稱,中國在開源大模型上的突出表現(xiàn),將進(jìn)一步提升中國在AI產(chǎn)業(yè)的話語權(quán)——引導(dǎo)全球更多開發(fā)者跟隨使用,也有利于AI整體生態(tài)的開放和完善。此前昆侖萬維推出并開源采用自回歸路線的“多模態(tài)統(tǒng)一預(yù)訓(xùn)練模型SkyworkUniPic”,在全球范圍內(nèi)也獲得關(guān)注。
值得注意的是,開源大模型洗牌非常激烈。
有數(shù)據(jù)顯示,曾經(jīng)爆火全網(wǎng)的大模型DeepSeek月活有下滑趨勢(shì)。據(jù)QuestMobile推出的《2025年二季度AI應(yīng)用價(jià)值榜》數(shù)據(jù)顯示,其月均下載量下滑72.2%,從八千多萬下載量跌至兩千多萬。
在年初成為大模型產(chǎn)業(yè)王炸黑馬后,DeepSeek成為國內(nèi)大模型廠商的集體競(jìng)標(biāo)對(duì)手,包括MiniMax、月之暗面等知名大模型公司或明或暗都提出了對(duì)標(biāo)DeepSeek的目標(biāo),且在更新迭代上進(jìn)展迅速。
目前,DeepSeek在旗下核心大模型R1升級(jí)后,尚未推出最新版本,未來大模型產(chǎn)業(yè)競(jìng)爭(zhēng)或?qū)⒃桨l(fā)激烈。
6部警察題材電視劇,總有一部你看過的?
讓“豪哥”趙燕國彰演這些烏七八糟的爛片,著實(shí)有些屈才了!
演員趙燕國彰:演張世豪走紅,娶了瑞典妻子,活成絕世好男人