谷藉
21世紀(jì)經(jīng)濟(jì)報(bào)道記者孫燕
大模型正從專用走向通用。
7月28日晚間,智譜發(fā)布新一代旗艦?zāi)P虶LM-4.5,并在HuggingFace與ModelScope平臺(tái)同步開源。
其綜合能力達(dá)到開源SOTA級(jí):綜合MMLUPro、AIME24、MATH500等12個(gè)基準(zhǔn)性能測(cè)試的平均分來看,GLM-4.5取得了全球模型第三、國(guó)產(chǎn)模型第一、開源模型第一的成績(jī)。
而GLM-4.5參數(shù)量?jī)H為DeepSeek-R1的1/2、Kimi-K2的1/3,之所以在多項(xiàng)標(biāo)準(zhǔn)基準(zhǔn)測(cè)試中表現(xiàn)得更為出色,是因?yàn)镚LM模型具有更高的參數(shù)效率。
調(diào)用價(jià)格方面,GLM-4.5系列的定價(jià)也遠(yuǎn)低于主流模型:API調(diào)用價(jià)格低至輸入0.8元/百萬tokens,輸出2元/百萬tokens。
值得一提的是,智譜首款SOTA(stateoftheart,是指在特定任務(wù)中目前表現(xiàn)最好的方法或模型)級(jí)原生智能體大模型,原生融合了推理、編碼和智能體能力。
同樣在7月,阿里云發(fā)布通義千問AI編程大模型Qwen3-Coder,階躍星辰發(fā)布新一代基礎(chǔ)大模型Step3,均集成了推理、代碼生成、智能體等能力。
民生證券研究指出,當(dāng)前全球多模態(tài)AI正在向“多模態(tài)通才”轉(zhuǎn)變,專家型模型逐漸走向支持多任務(wù)的通才和具備任務(wù)級(jí)協(xié)同能力的通才模式。
此前,智譜已經(jīng)有推理大模型GLM-Z1-Air和GLM-Z1-Flash,代碼大模型CodeGeeX-4,智能體模型AutoGLM等。此次推出的GLM-4.5,首次在單個(gè)模型中實(shí)現(xiàn)推理、編碼和智能體能力原生融合。
此前在7月初,智譜CEO張鵬在智譜開放平臺(tái)產(chǎn)業(yè)生態(tài)大會(huì)上演示大模型編寫PPT、生成小游戲的能力時(shí),也多次強(qiáng)調(diào)“原生”這一關(guān)鍵詞?!斑@完全由模型原生生成,沒有附加其他功能、第三方軟件和工作流。大模型在持續(xù)疊加越來越多的能力?!?/p>
有業(yè)內(nèi)人士指出,推理能力和智能體能力的融合,會(huì)帶來規(guī)劃能力更強(qiáng)的智能體;代碼能力和智能體能力本身便高度融合。三種能力的融合,有助于構(gòu)建一個(gè)以模型為主體的智能體。
“如今大模型的能力越來越多樣化,有文本類的、推理類的、工具類的,還有專門處理代碼任務(wù)的,但它們大多都‘偏科’,比如OpenAI的o系列模型最擅長(zhǎng)推理,Anthropic的Claude則特別精通代碼?!敝亲V相關(guān)負(fù)責(zé)人向21世紀(jì)經(jīng)濟(jì)報(bào)道記者表示,大模型的下一個(gè)范式,一定是把各種能力整合到一起,成為一個(gè)‘全優(yōu)生’,就像人一樣,越來越通用,這才是實(shí)現(xiàn)AGI的必要條件。
其進(jìn)一步指出,融合能力最大的意義在于讓AI從擅長(zhǎng)做一件事變成擅長(zhǎng)做多件事,也是讓AI越來越通用、越來越像人,能解決人的更多問題?!癘penAI的GPT-5也是這個(gè)方向?!?/p>
據(jù)測(cè)試,GLM-4.5在推理、代碼和智能體能力上均達(dá)到開源模型的最高水平,其中推理能力位列開源模型第二。
盡管同時(shí)集成推理、代碼、智能體等能力,但阿里Qwen3-Coder側(cè)重于代碼任務(wù)、階躍星辰Step3定位為原生多模態(tài)推理模型,智譜GLM-4.5則是專為智能體應(yīng)用打造的基礎(chǔ)模型。
GLM-4.5發(fā)布當(dāng)晚,張鵬在朋友圈表示,“GLM上新!全面進(jìn)入智能體基座時(shí)代!”
智譜對(duì)外表示,GLM-4.5首次在單個(gè)模型中實(shí)現(xiàn)將推理、編碼和智能體能力原生融合,是為了滿足智能體應(yīng)用的復(fù)雜需求。
在智譜演示的模型原生Agent場(chǎng)景中,GLM-4.5做出了能搜索的搜索引擎、能發(fā)彈幕的B站、能發(fā)博的微博。此外,GLM-4.5系列還能勝任全棧開發(fā)任務(wù),編寫復(fù)雜應(yīng)用、游戲、交互網(wǎng)頁(yè)。
在此背后,是模型原生具備的在前端編寫網(wǎng)站、在后端進(jìn)行數(shù)據(jù)庫(kù)管理,以及通過工具調(diào)用接口支持任意的智能體應(yīng)用等能力。
前述業(yè)內(nèi)人士指出,智能體包括以Coding(編碼)為核心的智能體、基于UI(用戶界面)的視覺識(shí)別智能體。GLM-4.5屬于前者,比較擅長(zhǎng)處理與Coding有關(guān)的任務(wù)。“如今萬物都可Coding,智能體基座最成熟的應(yīng)用場(chǎng)景還是接入CodingAgent(編碼智能體)?!?/p>
在AgentCoding場(chǎng)景中,通過ClaudeCode與Claude-4-Sonnet、Kimi-K2、Qwen3-Coder等模型進(jìn)行對(duì)比測(cè)試,GLM-4.5相對(duì)其他開源模型展現(xiàn)出競(jìng)爭(zhēng)優(yōu)勢(shì),特別在工具調(diào)用可靠性和任務(wù)完成度方面表現(xiàn)突出。盡管GLM-4.5相比Claude-4-Sonnet仍有提升空間,但在大部分場(chǎng)景中可以實(shí)現(xiàn)平替的效果。
7月29日,RokidGlasses、智聯(lián)招聘、脈脈、Lovart中國(guó)版“星流”、沉浸式翻譯、Flowith等均宣布即將接入GLM-4.5。
智譜還預(yù)告:Vibecoding模式即將推出。該模式由OpenAI聯(lián)合創(chuàng)始人AndrejKarpathy提出,其核心思想是通過自然語(yǔ)言提示驅(qū)動(dòng)AI生成代碼,從而減少手動(dòng)編碼的需求。這意味著,未來開發(fā)者只需用自然語(yǔ)言描述需求,AI即可生成相應(yīng)的代碼。
“AI越來越多地從后臺(tái)走向前臺(tái),早期AI能力是藏在后臺(tái)的功能模塊,比如說理解一句話、調(diào)起一個(gè)命令、喚醒一個(gè)音像,用戶對(duì)它的感知沒有那么明顯。到后來,出現(xiàn)了類似于ChatGPT的Copilot伴隨式模型,以及智能體應(yīng)用AINative的Agent。未來AI會(huì)下沉到中間層、底層,像操作系統(tǒng)一樣接管所有的硬件、軟件、數(shù)據(jù),你只需要通過跟ALM(大模型操作系統(tǒng))進(jìn)行自然語(yǔ)言層面的交互,它就能幫你調(diào)度底層能力,完成更多任務(wù)?!睆堸i在此前的演講中暢想道。
重生后我們分手,再見時(shí)她諷我落魄,卻不知我已逆襲
只是當(dāng)時(shí)的葉楓并不知道李蔓是來找自己分手的,還以為她就是想找自己像情侶一樣散散步,聊聊天?!班拧!比~楓點(diǎn)了點(diǎn)頭,跟在了李蔓的身后,兩個(gè)人穿過教室,教學(xué)樓,一路來到了人工湖的鵝卵石路上,這條路葉楓重生前的2001年和李蔓走過很多次?;蛟S是重生了一次的緣故。葉楓這一路發(fā)現(xiàn)了2001年的自己沒有發(fā)現(xiàn)說完了-|。
小說:重生逆襲,遇渣男之子,她該愛還是狠虐?
重生2001,女友提分手,我該如何逆襲?今日推薦:《重生之再鑄青春》作者:孤鴻寡鵠|_。點(diǎn)擊文末超鏈接開始觀看吧~第1606章有錢人這么直接的嗎周妍已經(jīng)被眼前這一幕的排場(chǎng)震驚的說不出話來,奔馳s600……我的天。而且周妍也注意到了潘坤手背上有著厚厚的老繭,一看就是練家子,估計(jì)是男神的私人保鏢,也是,像男神后面會(huì)介紹——。
重生嗅出男友謊言,果斷分手逆襲,他卻悔不當(dāng)初求復(fù)合
重生歸來,她從笑柄逆襲,分手夜轉(zhuǎn)身?yè)肀職g!今日推薦:《重生之笑柄逆襲》作者:shangweikeji|——。點(diǎn)擊文末超鏈接開始觀看吧~第1章次日,我下樓時(shí),他們正在餐廳膩歪-|。唐若雪挽著我,笑得甜膩:“清弦,你怎么睡這么晚?我和阿琛還想叫你呢-——?!蔽页槌鍪?,淡淡道:“有心了?!睆街弊筋欥?duì)面_。她笑容好了吧!
來源:紅網(wǎng)
作者:雷陽(yáng)文
編輯:鄲俏麗
本文為紅辣椒評(píng)論 原創(chuàng)文章,僅系作者個(gè)人觀點(diǎn),不代表紅網(wǎng)立場(chǎng)。轉(zhuǎn)載請(qǐng)附原文出處鏈接和本聲明。