劉右德
新智元報(bào)道
定慧犀牛
【新智元導(dǎo)讀】智譜新一代旗艦「融合大模型」GLM-4.5,集成推理、代碼與智能體能力,實(shí)現(xiàn)原生智能體模式。該模型具備極高性價(jià)比與生成速度,支持全棧Agent開發(fā)、網(wǎng)頁創(chuàng)作、PPT生成等多功能,實(shí)際表現(xiàn)驚艷。
GPT-5還沒影子,但國產(chǎn)這邊一個(gè)「融合大模型」已經(jīng)炸出來了!
智譜「悄悄的」發(fā)布了最新的旗艦版本模型GLM-4.5,這是一個(gè)全新的「融合大模型」,主打AgentFoundationModel。
相較于其他模型競(jìng)相「卷參數(shù)、刷榜單」,GLM-4.5這次選擇了不一樣的路線——不跟風(fēng),不內(nèi)卷,而是直接「狙擊GPT-5」!
GLM-4.5融合ARC(Agentic/Reasoning/Coding)能力,將推理、編程與Agent能力原生整合,走向更通用、更高效的AI形態(tài)。
體驗(yàn)地址:https://chat.z.ai/
都說GPT-5也要融合o系列、GPT系列和Agent能力,但是奧特曼一直跳票,沒想到被我們「領(lǐng)先了」。
值得一提的是,OpenAI還在6月25日公開叫板智譜,在一篇名為《ChineseProgressattheFront》的文章中,OpenAI將智譜(而不是DeepSeeek)列入全球競(jìng)爭(zhēng)對(duì)手,出乎所有人意料。
這也說明智譜已經(jīng)可以威脅到OpenAI的發(fā)展。
既然已經(jīng)公開叫板,智譜不再低調(diào)了,這個(gè)最新模型就要干翻o3!
最近,有人爆料GPT-5在WebDevArena上有個(gè)匿名為「龍蝦」的測(cè)試版。說是測(cè)試后效果驚人,用同樣的提示詞左邊是GPT-5生成的頁面,右邊是Grok4版本,看起來確實(shí)GPT-5生成的頁面更「炫酷」。
但是用GLM-4.5實(shí)測(cè)后,我們發(fā)現(xiàn)這個(gè)「融合模型」強(qiáng)得離譜,同樣的提示詞,隨手「二連抽」的效果都是SSR級(jí)別!
這個(gè)效果還是可以交互的頁面,畫面表現(xiàn)能力和復(fù)雜程度已經(jīng)遠(yuǎn)超Grok4,和GPT-5都不相上下。
提示詞:Createastunning,interactiveanimationofaneuralnetworkorbrain-likegraphstructure—useartisticcolors,smoothtransitions,andbeautifulvisuals.Thepageshouldfeelalive,immersive,andimpressive,withnobuttons—justscrollingorcontinuousanimation.Makeitbreathtaking.
在GLM-4.5上我們做了各種測(cè)試,然后就一發(fā)不可收拾了,這兩天已經(jīng)玩嗨了!
GLM-4.5不僅能整活做網(wǎng)站,還能一鍵生成PPT,還新增「Full-Stack全棧功能」可以實(shí)現(xiàn)在線Agent,而且完成任務(wù)的源代碼還能直接下載!
對(duì)于開發(fā)者來說,僅需兩行代碼就可以將GLM-4.5絲滑接入到現(xiàn)在最火的代碼工具ClaudeCode中。
從此可以放棄又貴又不穩(wěn)定的Claudeapi,體驗(yàn)到性能強(qiáng)勁、很便宜的GLM-4.5。
而且!智譜這次發(fā)布GLM-4.5下足了本錢,「智譜瘋狂星期一,V我50,即可包月無限量調(diào)用API」!先到先得!
它每次生成的效果都遠(yuǎn)超預(yù)期!
而且非常的快,能明顯感受到任務(wù)吐「token」的速度遙遙領(lǐng)先。
尤其是這個(gè)模型給人的感覺就好像是打通了任督二脈,一下子融合了「智能體、推理和代碼能力」的所有能力。
就好像只用一個(gè)模型,就同時(shí)擁有了CladueCode+Manus+ReasoningModel的所有能力。
再也不用像OpenAI的ChatGPT,每次還要選擇使用哪個(gè)模式。
這才像未來AI該有的樣子,AI就應(yīng)該像鋼鐵俠「賈維斯」一樣,只需Chat!
使用GLM-4.5最直接的感受就是,太強(qiáng)了!
在模擬飛行器從地球飛往火星的過程,完全按照太空力學(xué)中的「霍曼轉(zhuǎn)移軌道」(Hohmanntransferorbit)來構(gòu)建。
要知道這個(gè)Prompt當(dāng)時(shí)很多網(wǎng)友實(shí)測(cè)Gemini2.5、Claude和Grok時(shí)都沒有實(shí)現(xiàn)。
這個(gè)頁面用到了模型最新的Full-Stack全棧能力,完全就是一個(gè)在線Agent,這才是真正的VibeCoding!
為綜合衡量模型的通用能力,智譜選擇了最具有代表性的12個(gè)評(píng)測(cè)基準(zhǔn),包括MMLUPro、AIME24、MATH500、SciCode、GPQA、HLE、LiveCodeBench、SWE-Bench、Terminal-bench、TAU-Bench、BFCLv3和BrowseComp。
綜合平均分,GLM-4.5取得了全球模型第三、國產(chǎn)模型第一,開源模型第一!
融合「更多」能力,實(shí)現(xiàn)最佳性能
GLM-4.5為何選擇將「融合」作為主攻的方向?
所有大模型的目標(biāo)都是為了實(shí)現(xiàn)AGI,但是關(guān)于如何定義AGI,學(xué)界還沒有達(dá)成統(tǒng)一。
從第一性原理出發(fā),一個(gè)模型能夠在不影響原有能力的情況下,融合更多的通用智能能力一定是一個(gè)方向。
GLM-4.5就是對(duì)此理念的首次完整呈現(xiàn)。
GLM-4.5首次在單個(gè)模型中實(shí)現(xiàn)了推理、代碼、Agentic等多能力原生融合:
GLM-4.5在AgenticCoding盲測(cè)中實(shí)現(xiàn)國內(nèi)最佳
GLM-4.5在推理、代碼、智能體綜合能力方面(平均分)刷新開源SOTA
GLM-4.5采用混合專家(MoE)架構(gòu),包括
GLM-4.5:總參數(shù)量355B、激活參數(shù)量32B
GLM-4.5-Air:總參數(shù)量106B、激活參數(shù)量12B
GLM-4.5支持thinking(推理增強(qiáng))與non-thinking(通用生成)兩種工作模式,兼顧推理能力與通用響應(yīng)效率。
GLM-4.5的參數(shù)量為DeepSeek-R1的1/2、Kimi-K2的1/3,但在多項(xiàng)標(biāo)準(zhǔn)基準(zhǔn)測(cè)試中表現(xiàn)得更為出色。
這得益于GLM模型更高的參數(shù)效率。
GLM-4.5-Air以106B總參數(shù)/12B激活參數(shù)實(shí)現(xiàn)了重要突破,在ArtificialAnalysis等推理基準(zhǔn)上超越Gemini2.5Flash、Qwen3-235B、Claude4Opus等大模型,性能位列國產(chǎn)前三。
在SWE-BenchVerified等圖譜中,GLM-4.5系列位于性能/參數(shù)比帕累托前沿,這表明在相同規(guī)模下,GLM-4.5系列實(shí)現(xiàn)了最佳性能。
速度和性價(jià)比,國內(nèi)SOTA
GLM-4.5系列也在調(diào)用成本和生成效率上實(shí)現(xiàn)突破:API調(diào)用價(jià)格低至輸入0.8元/百萬tokens,輸出2元/百萬tokens,遠(yuǎn)低于主流模型定價(jià)。
同時(shí),高速版本實(shí)測(cè)生成速度超過100tokens/秒,支持低延遲、高并發(fā)的實(shí)際部署需求。
不過現(xiàn)在的新模型評(píng)測(cè)跑分也就看個(gè)熱鬧,真正還得要實(shí)測(cè)見真章!
就拿上面「模擬飛行器從地球飛往火星,并且完全遵循現(xiàn)實(shí)世界物理規(guī)律」來測(cè)試,大部分只寫前端代碼的模型幾乎都很難一次搞定。
我們先讓GLM-4.5先不要考慮真實(shí)物理參數(shù),而是演示完整的運(yùn)動(dòng)路徑。
GLM-4.5一下子就理解了!
GLM-4.5畫出了飛行器飛往火星的演示過程,并且還提供了兩種視角。
一種是全局視角。
另一種是「第一視角」,你可以跟隨飛行器從地球飛往火星。
GLM-4.5還貼心的在飛行器后面「畫了」一個(gè)噴火的尾焰,不要太絕!
但是,這依然只是展示,如果想要讓飛行器完全按照真實(shí)飛行來構(gòu)建呢?
這里就需要選擇Full-Stack!
通過Full-Stack,GLM-4.5就能構(gòu)建一個(gè)完整的應(yīng)用。
同樣的提示詞,使用全棧功能后,最終的效果要比單純的寫一段前端網(wǎng)頁代碼要Solid太多。
這個(gè)比例基本也符合我們對(duì)于廣袤宇宙的認(rèn)識(shí),一艘飛行器孤獨(dú)地前往火星。
選中全棧功能,你甚至可以獲得這個(gè)項(xiàng)目所有源代碼!這不就是相當(dāng)于一個(gè)Cursor了嗎?!
關(guān)鍵在于,這些都是免費(fèi)開源的!
絲滑接入ClaudeCode
GLM-4.5的代碼能力如此之強(qiáng),你還可以通過一個(gè)兼容AnthropicAPI的端點(diǎn)將其與ClaudeCode集成。
只需要兩行代碼,就能用GLM-4.5來驅(qū)動(dòng)你的ClaudeCode了。
方法也十分簡(jiǎn)單。
首先,申請(qǐng)一個(gè)智譜開放平臺(tái)APIKey。
地址:https://open.bigmodel.cn/usercenter/proj-mgmt/apikeys
安裝ClaudeCode后,運(yùn)行以下兩行代碼即可。
exportANTHROPIC_BASE_URL=https://open.bigmodel.cn/api/anthropicexportANTHROPIC_AUTH_TOKEN="yourbigmodelAPIkeys"看到這個(gè)界面后,就可以使用啦。
我們用最常見的貪吃蛇游戲來測(cè)試一下以GLM-4.5為核心的ClaudeCode效果如何。
中間經(jīng)過一次對(duì)話調(diào)整后,GLM-4.5成功生成一個(gè)相當(dāng)炸裂的、完全符合提示要求的游戲!
游戲不僅畫面精美、計(jì)分準(zhǔn)確,得分后還會(huì)有一個(gè)十分自然的動(dòng)畫效果,非常驚艷。
AIPPT:打工人的最佳「伴侶」
此次GLM-4.5還有一個(gè)功能也驚艷到了我們。
就是這個(gè)AIPPT(AISliders)功能!
實(shí)際測(cè)試后,真的和別的Agent制作PPT的感受完全不同!
下面這個(gè)是默認(rèn)的例子,你可以看到整個(gè)PPT的配色和風(fēng)格并不是像其他Agent的單一母版背景。
并且制作好的PPT也可以一鍵發(fā)布,分享給任何人。
PPT生成后可一鍵發(fā)布
在測(cè)試中,只上傳了一張圖片,就能讓GLM-4.5「看圖說話」,比如這張很抽象的把「奧特曼+龍蝦+GPT-5」放一起封面。
最終生成PPT演示
GLM-4.5能夠準(zhǔn)確的把握到圖片中信息,并且還調(diào)用了搜索引擎完善了內(nèi)容。
不論是「整活」測(cè)試代碼能力,還是「正經(jīng)」的完成PPT制作,GLM-4.5都遠(yuǎn)超預(yù)期。
使用下來最大的感受,「如絲般順滑」,每一個(gè)任務(wù)都幾乎沒有卡殼,也不用多次抽卡,幾乎每個(gè)任務(wù)都能有效完成。
并且由于GLM-4.5在模型中融合ARC能力(Agentic/Reasoning/Coding),幾乎任何問題都可以在「當(dāng)前聊天框」里解決。
比如我可以讓GLM-4.5幫我臨時(shí)制作一個(gè)生辰八字計(jì)算器。
在ARC和Full-Stack能力的加持下,日常需求直接就可以轉(zhuǎn)化為產(chǎn)品,不僅自己可用,而且可以分享出去。
大模型的「軍備競(jìng)賽」發(fā)展至今,光是聽說的模型已經(jīng)兩只手都數(shù)不過來了,ChatGPT、Gemini、Claude、Qwen、DeepSeek、GLM、Kimi…
OpenAI的ChatGPT更是給模型起了多個(gè)名字:GPT-4.1、GPT-4.5、o1-pro、o3、o3-pro、o4-mini。。。簡(jiǎn)直讓人無從下手。
但是很多模型都忘記了AI原本是要「服務(wù)于人」的初衷,變成了刷榜比賽,比如Meta的Llama4的滑鐵盧就因?yàn)樗癯舐劧稹?/p>
這次,智譜GLM4.5和OpenAIGPT-5「心照不宣」的都決定采用「融合大模型」路線。
放棄刷榜和無聊的命名游戲,回歸到真正追求AGI的初心。
就像智譜所說,真實(shí)體驗(yàn)永遠(yuǎn)比刷榜更重要。
目前,GLM-4.5的API已上線開放平臺(tái)BigModel.cn,可以一鍵兼容ClaudeCode框架。也可以上智譜清言(chatglm.cn)和Z.ai免費(fèi)體驗(yàn)滿血版。
國內(nèi)用戶:
https://docs.bigmodel.cn/cn/guide/develop/claude
海外用戶:
https://docs.z.ai/scenario-example/develop-tools/claude
體驗(yàn)地址:
https://chat.z.ai/
https://chatglm.cn
Github倉庫:
https://github.com/zai-org/GLM-4.5
模型倉庫:
HuggingFace:
https://huggingface.co/collections/zai-org/glm-45-687c621d34bda8c9e4bf503b
ModelScope:
https://modelscope.cn/collections/GLM-45-b8693e2a08984f
同時(shí),智譜還公布了實(shí)測(cè)的52道題目及Agent軌跡,供業(yè)界驗(yàn)證。
Agent軌跡:
https://huggingface.co/datasets/zai-org/CC-Bench-trajectories
參考資料:
https://chatglm.cn/
https://chat.z.ai/
尚書千金穿越成王妃,智斗腹黑皇子,醫(yī)術(shù)高超醫(yī)好殘廢雙腿
《我家王妃是逗比》 作者:北九竹內(nèi)容簡(jiǎn)介:一朝穿越成尚書千金,爹不疼娘不愛,還要逼著她嫁人! 聽說要嫁的是皇帝最寵愛的皇子?皇子我喜歡,財(cái)大氣粗! 聽說要嫁的皇子是個(gè)殘廢?殘廢我喜歡,任我拿捏! 一手醫(yī)術(shù)妙手回春,醫(yī)好皇子殘廢雙腿,原本想拉著皇子給自己撐腰,結(jié)果誰想到這個(gè)皇子竟是個(gè)腹還有呢?
小說:尚書千金被迫嫁殘廢皇子,我醫(yī)好他腿,反被他拿捏!
第一本:《我家王妃是逗比》作者:北九竹簡(jiǎn)介:一朝穿越成尚書千金,爹不疼娘不愛,還要逼著她嫁人!聽說要嫁的是皇帝最寵愛的皇子?皇子我喜歡,財(cái)大氣粗!聽說要嫁的皇子是個(gè)殘廢?殘廢我喜歡,任我拿捏!一手醫(yī)術(shù)妙手回春,醫(yī)好皇子殘廢雙腿,原本想拉著皇子給自己撐腰,結(jié)果誰想到這個(gè)皇子竟是個(gè)腹黑的!精彩還有呢?
喜歡《我家王妃是逗比》的你不容錯(cuò)過的寶藏書單,余生因你而甜
《我家王妃是逗比》作者:北九竹第1章沖喜娘子是趣人大周國,京城!今天是八月十八,是一個(gè)吉祥的日子,也是大周國戰(zhàn)神霄王牧夜霄和千尚書之女,千羽歌的大婚之日。十里紅妝,一百六十臺(tái)嫁妝,此時(shí)正在朝著霄王府前行著。鑼鼓吹吹打打,四周都圍滿了百姓_。本該是個(gè)歡慶的日子,里面卻是傳出了幾聲嘆息——-?!?.
來源:紅網(wǎng)
作者:別芊
編輯:楊盈秀
本文為紅辣椒評(píng)論 原創(chuàng)文章,僅系作者個(gè)人觀點(diǎn),不代表紅網(wǎng)立場(chǎng)。轉(zhuǎn)載請(qǐng)附原文出處鏈接和本聲明。