馬上測(cè)|小心被偷拍!這些計(jì)算器、地圖背后竟有“鏡頭”
21世紀(jì)經(jīng)濟(jì)報(bào)道記者孫燕
大模型正從專用走向通用。
7月28日晚間,智譜發(fā)布新一代旗艦?zāi)P虶LM-4.5,并在HuggingFace與ModelScope平臺(tái)同步開源。
其綜合能力達(dá)到開源SOTA級(jí):綜合MMLUPro、AIME24、MATH500等12個(gè)基準(zhǔn)性能測(cè)試的平均分來看,GLM-4.5取得了全球模型第三、國(guó)產(chǎn)模型第一、開源模型第一的成績(jī)。
而GLM-4.5參數(shù)量?jī)H為DeepSeek-R1的1/2、Kimi-K2的1/3,之所以在多項(xiàng)標(biāo)準(zhǔn)基準(zhǔn)測(cè)試中表現(xiàn)得更為出色,是因?yàn)镚LM模型具有更高的參數(shù)效率。
調(diào)用價(jià)格方面,GLM-4.5系列的定價(jià)也遠(yuǎn)低于主流模型:API調(diào)用價(jià)格低至輸入0.8元/百萬(wàn)tokens,輸出2元/百萬(wàn)tokens。
值得一提的是,智譜首款SOTA(stateoftheart,是指在特定任務(wù)中目前表現(xiàn)最好的方法或模型)級(jí)原生智能體大模型,原生融合了推理、編碼和智能體能力。
同樣在7月,阿里云發(fā)布通義千問AI編程大模型Qwen3-Coder,階躍星辰發(fā)布新一代基礎(chǔ)大模型Step3,均集成了推理、代碼生成、智能體等能力。
民生證券研究指出,當(dāng)前全球多模態(tài)AI正在向“多模態(tài)通才”轉(zhuǎn)變,專家型模型逐漸走向支持多任務(wù)的通才和具備任務(wù)級(jí)協(xié)同能力的通才模式。
此前,智譜已經(jīng)有推理大模型GLM-Z1-Air和GLM-Z1-Flash,代碼大模型CodeGeeX-4,智能體模型AutoGLM等。此次推出的GLM-4.5,首次在單個(gè)模型中實(shí)現(xiàn)推理、編碼和智能體能力原生融合。
此前在7月初,智譜CEO張鵬在智譜開放平臺(tái)產(chǎn)業(yè)生態(tài)大會(huì)上演示大模型編寫PPT、生成小游戲的能力時(shí),也多次強(qiáng)調(diào)“原生”這一關(guān)鍵詞?!斑@完全由模型原生生成,沒有附加其他功能、第三方軟件和工作流。大模型在持續(xù)疊加越來越多的能力?!?/p>
有業(yè)內(nèi)人士指出,推理能力和智能體能力的融合,會(huì)帶來規(guī)劃能力更強(qiáng)的智能體;代碼能力和智能體能力本身便高度融合。三種能力的融合,有助于構(gòu)建一個(gè)以模型為主體的智能體。
“如今大模型的能力越來越多樣化,有文本類的、推理類的、工具類的,還有專門處理代碼任務(wù)的,但它們大多都‘偏科’,比如OpenAI的o系列模型最擅長(zhǎng)推理,Anthropic的Claude則特別精通代碼?!敝亲V相關(guān)負(fù)責(zé)人向21世紀(jì)經(jīng)濟(jì)報(bào)道記者表示,大模型的下一個(gè)范式,一定是把各種能力整合到一起,成為一個(gè)‘全優(yōu)生’,就像人一樣,越來越通用,這才是實(shí)現(xiàn)AGI的必要條件。
其進(jìn)一步指出,融合能力最大的意義在于讓AI從擅長(zhǎng)做一件事變成擅長(zhǎng)做多件事,也是讓AI越來越通用、越來越像人,能解決人的更多問題?!癘penAI的GPT-5也是這個(gè)方向。”
據(jù)測(cè)試,GLM-4.5在推理、代碼和智能體能力上均達(dá)到開源模型的最高水平,其中推理能力位列開源模型第二。
盡管同時(shí)集成推理、代碼、智能體等能力,但阿里Qwen3-Coder側(cè)重于代碼任務(wù)、階躍星辰Step3定位為原生多模態(tài)推理模型,智譜GLM-4.5則是專為智能體應(yīng)用打造的基礎(chǔ)模型。
GLM-4.5發(fā)布當(dāng)晚,張鵬在朋友圈表示,“GLM上新!全面進(jìn)入智能體基座時(shí)代!”
智譜對(duì)外表示,GLM-4.5首次在單個(gè)模型中實(shí)現(xiàn)將推理、編碼和智能體能力原生融合,是為了滿足智能體應(yīng)用的復(fù)雜需求。
在智譜演示的模型原生Agent場(chǎng)景中,GLM-4.5做出了能搜索的搜索引擎、能發(fā)彈幕的B站、能發(fā)博的微博。此外,GLM-4.5系列還能勝任全棧開發(fā)任務(wù),編寫復(fù)雜應(yīng)用、游戲、交互網(wǎng)頁(yè)。
在此背后,是模型原生具備的在前端編寫網(wǎng)站、在后端進(jìn)行數(shù)據(jù)庫(kù)管理,以及通過工具調(diào)用接口支持任意的智能體應(yīng)用等能力。
前述業(yè)內(nèi)人士指出,智能體包括以Coding(編碼)為核心的智能體、基于UI(用戶界面)的視覺識(shí)別智能體。GLM-4.5屬于前者,比較擅長(zhǎng)處理與Coding有關(guān)的任務(wù)?!叭缃袢f(wàn)物都可Coding,智能體基座最成熟的應(yīng)用場(chǎng)景還是接入CodingAgent(編碼智能體)?!?/p>
在AgentCoding場(chǎng)景中,通過ClaudeCode與Claude-4-Sonnet、Kimi-K2、Qwen3-Coder等模型進(jìn)行對(duì)比測(cè)試,GLM-4.5相對(duì)其他開源模型展現(xiàn)出競(jìng)爭(zhēng)優(yōu)勢(shì),特別在工具調(diào)用可靠性和任務(wù)完成度方面表現(xiàn)突出。盡管GLM-4.5相比Claude-4-Sonnet仍有提升空間,但在大部分場(chǎng)景中可以實(shí)現(xiàn)平替的效果。
7月29日,RokidGlasses、智聯(lián)招聘、脈脈、Lovart中國(guó)版“星流”、沉浸式翻譯、Flowith等均宣布即將接入GLM-4.5。
智譜還預(yù)告:Vibecoding模式即將推出。該模式由OpenAI聯(lián)合創(chuàng)始人AndrejKarpathy提出,其核心思想是通過自然語(yǔ)言提示驅(qū)動(dòng)AI生成代碼,從而減少手動(dòng)編碼的需求。這意味著,未來開發(fā)者只需用自然語(yǔ)言描述需求,AI即可生成相應(yīng)的代碼。
“AI越來越多地從后臺(tái)走向前臺(tái),早期AI能力是藏在后臺(tái)的功能模塊,比如說理解一句話、調(diào)起一個(gè)命令、喚醒一個(gè)音像,用戶對(duì)它的感知沒有那么明顯。到后來,出現(xiàn)了類似于ChatGPT的Copilot伴隨式模型,以及智能體應(yīng)用AINative的Agent。未來AI會(huì)下沉到中間層、底層,像操作系統(tǒng)一樣接管所有的硬件、軟件、數(shù)據(jù),你只需要通過跟ALM(大模型操作系統(tǒng))進(jìn)行自然語(yǔ)言層面的交互,它就能幫你調(diào)度底層能力,完成更多任務(wù)?!睆堸i在此前的演講中暢想道。
周末新書推薦:《聽時(shí)太太撒個(gè)嬌》新晉影后重生,被大佬保駕護(hù)航
百看不膩的年度好書《聽時(shí)太太撒個(gè)嬌》,越看越喜歡!
大膽熱戀,在他懷里撒個(gè)嬌,想入緋緋