新智元報道
定慧犀牛
【新智元導讀】智譜新一代旗艦「融合大模型」GLM-4.5,集成推理、代碼與智能體能力,實現(xiàn)原生智能體模式。該模型具備極高性價比與生成速度,支持全棧Agent開發(fā)、網頁創(chuàng)作、PPT生成等多功能,實際表現(xiàn)驚艷。
GPT-5還沒影子,但國產這邊一個「融合大模型」已經炸出來了!
智譜「悄悄的」發(fā)布了最新的旗艦版本模型GLM-4.5,這是一個全新的「融合大模型」,主打AgentFoundationModel。
相較于其他模型競相「卷參數(shù)、刷榜單」,GLM-4.5這次選擇了不一樣的路線——不跟風,不內卷,而是直接「狙擊GPT-5」!
GLM-4.5融合ARC(Agentic/Reasoning/Coding)能力,將推理、編程與Agent能力原生整合,走向更通用、更高效的AI形態(tài)。
體驗地址:https://chat.z.ai/
都說GPT-5也要融合o系列、GPT系列和Agent能力,但是奧特曼一直跳票,沒想到被我們「領先了」。
值得一提的是,OpenAI還在6月25日公開叫板智譜,在一篇名為《ChineseProgressattheFront》的文章中,OpenAI將智譜(而不是DeepSeeek)列入全球競爭對手,出乎所有人意料。
這也說明智譜已經可以威脅到OpenAI的發(fā)展。
既然已經公開叫板,智譜不再低調了,這個最新模型就要干翻o3!
最近,有人爆料GPT-5在WebDevArena上有個匿名為「龍蝦」的測試版。說是測試后效果驚人,用同樣的提示詞左邊是GPT-5生成的頁面,右邊是Grok4版本,看起來確實GPT-5生成的頁面更「炫酷」。
但是用GLM-4.5實測后,我們發(fā)現(xiàn)這個「融合模型」強得離譜,同樣的提示詞,隨手「二連抽」的效果都是SSR級別!
這個效果還是可以交互的頁面,畫面表現(xiàn)能力和復雜程度已經遠超Grok4,和GPT-5都不相上下。
提示詞:Createastunning,interactiveanimationofaneuralnetworkorbrain-likegraphstructure—useartisticcolors,smoothtransitions,andbeautifulvisuals.Thepageshouldfeelalive,immersive,andimpressive,withnobuttons—justscrollingorcontinuousanimation.Makeitbreathtaking.
在GLM-4.5上我們做了各種測試,然后就一發(fā)不可收拾了,這兩天已經玩嗨了!
GLM-4.5不僅能整活做網站,還能一鍵生成PPT,還新增「Full-Stack全棧功能」可以實現(xiàn)在線Agent,而且完成任務的源代碼還能直接下載!
對于開發(fā)者來說,僅需兩行代碼就可以將GLM-4.5絲滑接入到現(xiàn)在最火的代碼工具ClaudeCode中。
從此可以放棄又貴又不穩(wěn)定的Claudeapi,體驗到性能強勁、很便宜的GLM-4.5。
而且!智譜這次發(fā)布GLM-4.5下足了本錢,「智譜瘋狂星期一,V我50,即可包月無限量調用API」!先到先得!
它每次生成的效果都遠超預期!
而且非常的快,能明顯感受到任務吐「token」的速度遙遙領先。
尤其是這個模型給人的感覺就好像是打通了任督二脈,一下子融合了「智能體、推理和代碼能力」的所有能力。
就好像只用一個模型,就同時擁有了CladueCode+Manus+ReasoningModel的所有能力。
再也不用像OpenAI的ChatGPT,每次還要選擇使用哪個模式。
這才像未來AI該有的樣子,AI就應該像鋼鐵俠「賈維斯」一樣,只需Chat!
使用GLM-4.5最直接的感受就是,太強了!
在模擬飛行器從地球飛往火星的過程,完全按照太空力學中的「霍曼轉移軌道」(Hohmanntransferorbit)來構建。
要知道這個Prompt當時很多網友實測Gemini2.5、Claude和Grok時都沒有實現(xiàn)。
這個頁面用到了模型最新的Full-Stack全棧能力,完全就是一個在線Agent,這才是真正的VibeCoding!
為綜合衡量模型的通用能力,智譜選擇了最具有代表性的12個評測基準,包括MMLUPro、AIME24、MATH500、SciCode、GPQA、HLE、LiveCodeBench、SWE-Bench、Terminal-bench、TAU-Bench、BFCLv3和BrowseComp。
綜合平均分,GLM-4.5取得了全球模型第三、國產模型第一,開源模型第一!
融合「更多」能力,實現(xiàn)最佳性能
GLM-4.5為何選擇將「融合」作為主攻的方向?
所有大模型的目標都是為了實現(xiàn)AGI,但是關于如何定義AGI,學界還沒有達成統(tǒng)一。
從第一性原理出發(fā),一個模型能夠在不影響原有能力的情況下,融合更多的通用智能能力一定是一個方向。
GLM-4.5就是對此理念的首次完整呈現(xiàn)。
GLM-4.5首次在單個模型中實現(xiàn)了推理、代碼、Agentic等多能力原生融合:
GLM-4.5在AgenticCoding盲測中實現(xiàn)國內最佳
GLM-4.5在推理、代碼、智能體綜合能力方面(平均分)刷新開源SOTA
GLM-4.5采用混合專家(MoE)架構,包括
GLM-4.5:總參數(shù)量355B、激活參數(shù)量32B
GLM-4.5-Air:總參數(shù)量106B、激活參數(shù)量12B
GLM-4.5支持thinking(推理增強)與non-thinking(通用生成)兩種工作模式,兼顧推理能力與通用響應效率。
GLM-4.5的參數(shù)量為DeepSeek-R1的1/2、Kimi-K2的1/3,但在多項標準基準測試中表現(xiàn)得更為出色。
這得益于GLM模型更高的參數(shù)效率。
GLM-4.5-Air以106B總參數(shù)/12B激活參數(shù)實現(xiàn)了重要突破,在ArtificialAnalysis等推理基準上超越Gemini2.5Flash、Qwen3-235B、Claude4Opus等大模型,性能位列國產前三。
在SWE-BenchVerified等圖譜中,GLM-4.5系列位于性能/參數(shù)比帕累托前沿,這表明在相同規(guī)模下,GLM-4.5系列實現(xiàn)了最佳性能。
速度和性價比,國內SOTA
GLM-4.5系列也在調用成本和生成效率上實現(xiàn)突破:API調用價格低至輸入0.8元/百萬tokens,輸出2元/百萬tokens,遠低于主流模型定價。
同時,高速版本實測生成速度超過100tokens/秒,支持低延遲、高并發(fā)的實際部署需求。
不過現(xiàn)在的新模型評測跑分也就看個熱鬧,真正還得要實測見真章!
就拿上面「模擬飛行器從地球飛往火星,并且完全遵循現(xiàn)實世界物理規(guī)律」來測試,大部分只寫前端代碼的模型幾乎都很難一次搞定。
我們先讓GLM-4.5先不要考慮真實物理參數(shù),而是演示完整的運動路徑。
GLM-4.5一下子就理解了!
GLM-4.5畫出了飛行器飛往火星的演示過程,并且還提供了兩種視角。
一種是全局視角。
另一種是「第一視角」,你可以跟隨飛行器從地球飛往火星。
GLM-4.5還貼心的在飛行器后面「畫了」一個噴火的尾焰,不要太絕!
但是,這依然只是展示,如果想要讓飛行器完全按照真實飛行來構建呢?
這里就需要選擇Full-Stack!
通過Full-Stack,GLM-4.5就能構建一個完整的應用。
同樣的提示詞,使用全棧功能后,最終的效果要比單純的寫一段前端網頁代碼要Solid太多。
這個比例基本也符合我們對于廣袤宇宙的認識,一艘飛行器孤獨地前往火星。
選中全棧功能,你甚至可以獲得這個項目所有源代碼!這不就是相當于一個Cursor了嗎?!
關鍵在于,這些都是免費開源的!
絲滑接入ClaudeCode
GLM-4.5的代碼能力如此之強,你還可以通過一個兼容AnthropicAPI的端點將其與ClaudeCode集成。
只需要兩行代碼,就能用GLM-4.5來驅動你的ClaudeCode了。
方法也十分簡單。
首先,申請一個智譜開放平臺APIKey。
地址:https://open.bigmodel.cn/usercenter/proj-mgmt/apikeys
安裝ClaudeCode后,運行以下兩行代碼即可。
exportANTHROPIC_BASE_URL=https://open.bigmodel.cn/api/anthropicexportANTHROPIC_AUTH_TOKEN="yourbigmodelAPIkeys"看到這個界面后,就可以使用啦。
我們用最常見的貪吃蛇游戲來測試一下以GLM-4.5為核心的ClaudeCode效果如何。
中間經過一次對話調整后,GLM-4.5成功生成一個相當炸裂的、完全符合提示要求的游戲!
游戲不僅畫面精美、計分準確,得分后還會有一個十分自然的動畫效果,非常驚艷。
AIPPT:打工人的最佳「伴侶」
此次GLM-4.5還有一個功能也驚艷到了我們。
就是這個AIPPT(AISliders)功能!
實際測試后,真的和別的Agent制作PPT的感受完全不同!
下面這個是默認的例子,你可以看到整個PPT的配色和風格并不是像其他Agent的單一母版背景。
并且制作好的PPT也可以一鍵發(fā)布,分享給任何人。
PPT生成后可一鍵發(fā)布
在測試中,只上傳了一張圖片,就能讓GLM-4.5「看圖說話」,比如這張很抽象的把「奧特曼+龍蝦+GPT-5」放一起封面。
最終生成PPT演示
GLM-4.5能夠準確的把握到圖片中信息,并且還調用了搜索引擎完善了內容。
不論是「整活」測試代碼能力,還是「正經」的完成PPT制作,GLM-4.5都遠超預期。
使用下來最大的感受,「如絲般順滑」,每一個任務都幾乎沒有卡殼,也不用多次抽卡,幾乎每個任務都能有效完成。
并且由于GLM-4.5在模型中融合ARC能力(Agentic/Reasoning/Coding),幾乎任何問題都可以在「當前聊天框」里解決。
比如我可以讓GLM-4.5幫我臨時制作一個生辰八字計算器。
在ARC和Full-Stack能力的加持下,日常需求直接就可以轉化為產品,不僅自己可用,而且可以分享出去。
大模型的「軍備競賽」發(fā)展至今,光是聽說的模型已經兩只手都數(shù)不過來了,ChatGPT、Gemini、Claude、Qwen、DeepSeek、GLM、Kimi…
OpenAI的ChatGPT更是給模型起了多個名字:GPT-4.1、GPT-4.5、o1-pro、o3、o3-pro、o4-mini。。。簡直讓人無從下手。
但是很多模型都忘記了AI原本是要「服務于人」的初衷,變成了刷榜比賽,比如Meta的Llama4的滑鐵盧就因為刷榜丑聞而起。
這次,智譜GLM4.5和OpenAIGPT-5「心照不宣」的都決定采用「融合大模型」路線。
放棄刷榜和無聊的命名游戲,回歸到真正追求AGI的初心。
就像智譜所說,真實體驗永遠比刷榜更重要。
目前,GLM-4.5的API已上線開放平臺BigModel.cn,可以一鍵兼容ClaudeCode框架。也可以上智譜清言(chatglm.cn)和Z.ai免費體驗滿血版。
國內用戶:
https://docs.bigmodel.cn/cn/guide/develop/claude
海外用戶:
https://docs.z.ai/scenario-example/develop-tools/claude
體驗地址:
https://chat.z.ai/
https://chatglm.cn
Github倉庫:
https://github.com/zai-org/GLM-4.5
模型倉庫:
HuggingFace:
https://huggingface.co/collections/zai-org/glm-45-687c621d34bda8c9e4bf503b
ModelScope:
https://modelscope.cn/collections/GLM-45-b8693e2a08984f
同時,智譜還公布了實測的52道題目及Agent軌跡,供業(yè)界驗證。
Agent軌跡:
https://huggingface.co/datasets/zai-org/CC-Bench-trajectories
參考資料:
https://chatglm.cn/
https://chat.z.ai/
十分暢銷的《陪你到世界盡頭》,愛你是我此生最浪漫的事
暗戀成真執(zhí)手偕老,陪你一起走到世界盡頭
書友推薦《陪你到世界盡頭》為什么必須追完再睡覺!
免責聲明:本文內容由開放的智能模型自動生成,僅供參考。