當(dāng)業(yè)界探討智能體功能、開發(fā)環(huán)境時(shí),近日北京智譜華章科技股份有限公司(以下簡稱"智譜")低調(diào)發(fā)布新一代旗艦大模型GLM-4.5,這是一款專為智能體應(yīng)用打造的基礎(chǔ)模型,在復(fù)雜推理、代碼生成及智能體交互等通用能力上實(shí)現(xiàn)能力融合與技術(shù)突破。OpenAI"跳票"多次的GPT-5也強(qiáng)調(diào)融合,并在6月底將智譜列入全球競爭對手,沒想到智譜率先登場,GLM-4.5的綜合得分位列全球第三、國產(chǎn)第一。
在資本市場,智譜也是"沉默的領(lǐng)跑者",4月已在北京證監(jiān)局辦理上市輔導(dǎo)備案,由中金公司擔(dān)任輔導(dǎo)機(jī)構(gòu),成為第一家啟動(dòng)IPO上市的"大模型六小虎"。根據(jù)輔導(dǎo)備案報(bào)告,8月智譜將進(jìn)入正式輔導(dǎo)期第二階段,在這期間,這家脫胎于清華的大模型公司還密集收獲多地國資的戰(zhàn)略投資。從實(shí)驗(yàn)室到產(chǎn)業(yè),智譜走出了中國通向AGI(通用人工智能)的另一條路徑。
全球第三,國產(chǎn)第一
最近的開源浪潮中,智譜的GLM-4.5發(fā)布僅2小時(shí),就被X平臺(tái)推薦上了首頁,發(fā)布12小時(shí)后,它已經(jīng)位列國際開源社區(qū)Hugging-Face榜單全球第二,創(chuàng)增速紀(jì)錄。
在涵蓋研究生水平推理和復(fù)雜軟件工程解題等12項(xiàng)全球公認(rèn)的硬核測試中,GLM-4.5的綜合得分位列全球第三,在所有國產(chǎn)模型和開源模型中均排名第一。
GLM-4.5采用混合專家(MoE)架構(gòu),GLM-4.5總參數(shù)量3550億,激活參數(shù)320億;GLM-4.5-Air總參數(shù)1060億,激活參數(shù)120億,有用于復(fù)雜推理和工具使用的思考模式,及用于即時(shí)響應(yīng)的非思考模式。在包含推理、代碼、智能體的綜合能力測評中,GLM-4.5達(dá)到開源SOTA(即"當(dāng)前最佳技術(shù)"或"最前沿水平"),在真實(shí)代碼智能體的人工對比評測中,實(shí)測國內(nèi)最佳。
真實(shí)場景表現(xiàn)比榜單更重要。在真實(shí)場景AgenticCoding(AgenticCoding)中,52個(gè)編程開發(fā)任務(wù),涵蓋六大開發(fā)領(lǐng)域的測試中,GLM-4.5與ClaudeCode、Claude-4-Sonnet、Kimi-K2、Qwen3-Coder進(jìn)行對比測試,結(jié)果顯示,GLM-4.5相對其他開源模型展現(xiàn)出競爭優(yōu)勢,特別在工具調(diào)用可靠性和任務(wù)完成度方面表現(xiàn)突出。盡管GLM-4.5相比Claude-4-Sonnet仍有提升空間,在大部分場景中可以實(shí)現(xiàn)平替的效果。
在成本角度,GLM-4.5的API調(diào)用價(jià)格輸入0.8元/百萬tokens、輸出2元/百萬tokens;高速版最高100tokens/秒。綜合成本和、參數(shù)和表現(xiàn),外界給GLM-4.5以"成本更低、性能更優(yōu)"的評價(jià)。
專為智能體
"效果確實(shí)不錯(cuò)的",體驗(yàn)GLM-4.5后,某大模型六小虎的一位技術(shù)專家向北京商報(bào)記者反饋,他特別提到效果是指"使用這個(gè)模型開發(fā)Agent(智能體)"。這也是GLM-4.5的特點(diǎn)。
據(jù)了解,GLM-4.5模型能夠勝任全棧開發(fā)任務(wù),一鍵生成較為復(fù)雜的應(yīng)用、游戲、交互網(wǎng)頁。在實(shí)際例子中,用戶通過z.ai使用該模型時(shí),僅用一句簡單的指令,就可讓GLM-4.5獨(dú)立開發(fā)出具備搜索功能的"谷歌"網(wǎng)站、可以發(fā)彈幕的"B站",甚至直接上線一個(gè)完整的"FlappyBird"小游戲。
簡單來說,GLM-4.5的最大亮點(diǎn)是這是首款原生融合模型,首次在單個(gè)模型中實(shí)現(xiàn)將推理、編碼和智能體能力原生融合,以滿足智能體應(yīng)用的復(fù)雜需求。
大語言模型的目標(biāo)是在廣泛領(lǐng)域達(dá)到人類認(rèn)知水平。然而,現(xiàn)有模型仍然算不上真正的通用模型:有些擅長編程,有些精于數(shù)學(xué),有些在推理方面表現(xiàn)出色,但沒有一個(gè)能在所有任務(wù)上都達(dá)到最佳表現(xiàn)。GLM-4.5正是朝著統(tǒng)一各種能力這一目標(biāo)努力,力求在一個(gè)模型中集成所有這些不同的能力。大模型的下一個(gè)范式,一定是把各種能力整合到一起,成為一個(gè)"全優(yōu)生"。
巧合的一點(diǎn)是,6月智譜曾被OpenAI"點(diǎn)名",將其定義為全球競爭對手。對于類似GLM-4.5的融合式模型,OpenAI也早有提及。
2024年1月,OpenAICEO山姆·奧特曼曾在接受媒體采訪時(shí)提到,他現(xiàn)在的首要任務(wù)是推出可能被稱為GPT-5的新模型,并稱GPT-5將能夠比現(xiàn)有模型做更多的事情。2025年2月13日,他宣布,OpenAI將在未來幾個(gè)月內(nèi)推出名為GPT-5的模型,該模型將整合OpenAI的大量技術(shù),包括o3,并應(yīng)用于聊天機(jī)器人ChatGPT以及API平臺(tái)。此后,OpenAI高管曾透露7月是GPT-5目標(biāo)推出時(shí)間,后來山姆·奧特曼將這個(gè)時(shí)間推遲到8月初。
成為"全優(yōu)生"
這一切讓外界不禁好奇,智譜與OpenAI有哪些異同?針對這個(gè)問題,智譜CEO張鵬在接受媒體采訪時(shí)表示,相似之處在于雙方都在各自國家較早地開始訓(xùn)練大模型。雙方都努力探索不同方向的能力邊界。
"大家都不知道人工智能的邊界到底在哪里。OpenAI在2023年后探索了很多方向,比如o系列模型。我們也在探索各種各樣的模型,例如我們此次發(fā)布的首個(gè)原生融合模型,就代表行業(yè)一個(gè)新的發(fā)展方向。"他進(jìn)一步說,現(xiàn)有模型仍然算不上真正的通用模型:有些擅長編程,有些精于數(shù)學(xué),有些在推理方面表現(xiàn)出色,但沒有一個(gè)能在所有任務(wù)上都達(dá)到最佳表現(xiàn)。GLM-4.5正是朝著統(tǒng)一各種能力這一目標(biāo)努力,力求在一個(gè)模型中集成所有這些不同的能力。大模型的下一個(gè)范式,一定是把各種能力整合到一起,成為一個(gè)"全優(yōu)生",就像人一樣,擁有越來越通用的能力。
拋開技術(shù),在外界眼中智譜的學(xué)術(shù)背景在一眾同行中更突出。"智譜作為脫胎于清華的大模型公司,其核心優(yōu)勢主要體現(xiàn)在技術(shù)積累和產(chǎn)學(xué)研結(jié)合方面。"科方得智庫研究負(fù)責(zé)人張新原向北京商報(bào)記者表示,"獲得多地國資戰(zhàn)略投資也顯示出智譜在資源整合和政策支持方面的優(yōu)勢。"
北京社科院副研究員王鵬也提到了智譜的股東,"它的股東背景多元,這樣可以讓智譜同時(shí)獲得應(yīng)用場景、政務(wù)資源、國際市場等支持"。
作為正在上市路上的大模型創(chuàng)業(yè)公司,恰逢風(fēng)頭正盛的具身智能也正奔赴資本市場,會(huì)否受到影響?王鵬告訴北京商報(bào)記者,"具身智能聚焦機(jī)器人、物理世界交互,智譜專注通用大模型與智能體,兩者在應(yīng)用場景、技術(shù)棧、客戶群體差異顯著,直接競爭較少。具身智能目前處于概念驗(yàn)證階段,商業(yè)化路徑尚不清晰,而智譜商業(yè)模式相對成熟"。
北京商報(bào)記者魏蔚