黃建宏
只需說句話,它就可以幫助普通用戶做一個真實可用的“谷歌”“B站”“微博”網站,還可以幫助寫PPT、找配圖,或者生成一個可以交互的小游戲。近日,北京智譜華章科技股份有限公司(以下簡稱"智譜AI")發(fā)布其新一代旗艦大模型GLM-4.5。這是一款專為智能體應用打造的基礎模型,首次在單個模型中實現將推理、編碼和智能體能力原生融合,它能勝任全棧開發(fā)任務,編寫復雜應用、游戲、交互網頁等。據悉,GLM-4.5在高速輸出的同時API調用價格低至0.8元/百萬tokens。
專為智能體應用打造基礎模型
智能體是一種有自主行動能力,能夠思考與外部環(huán)境或工具交互的系統。簡單來說,它看起來像一個智能小助手,可以幫人類完成各種任務,目前各大公司都在開發(fā)AI智能體,功能與側重有所區(qū)別。此次智譜發(fā)布的大模型GLM-4.5則是一款專為智能體應用打造的基礎模型?!案鶕易约旱捏w驗發(fā)現,這款大模型的性能強大,而且便于智能體調用”,腦仁智能創(chuàng)始人汪楊告訴北青報記者,自己已經體驗了這款模型,“體感處于業(yè)內領先,接近國外最先進的模型”。
GLM-4.5首次在單個模型中實現將推理、編碼和智能體能力原生融合,以滿足智能體應用的復雜需求。也就是說,用戶只需要描述需求,GLM-4.5可以先分析推理用戶想要實現什么任務,如何實現;再根據自己的推理進行編碼,開發(fā)出適合的一整套代碼來;最后生成一個智能體,用戶又可以簡單明了地看到“跑通后”的結果。
汪楊表示,“現在在大模型應用中,智能體應用及AI編程等場景的調用量非常高,且還在持續(xù)增長。但這對于模型的綜合能力,尤其是邏輯能力要求較高。”他表示,因此智譜此次專門為智能體應用打造的基礎模型非常有必要,且它的開源屬性更便于私有部署,尤其對于擔心數據泄露的客戶來說。
在參數量方面,它采用混合專家(MoE)架構,包括GLM-4.5:總參數量3550億,激活參數320億;GLM-4.5-Air:總參數1060億,激活參數120億。GLM-4.5參數量為DeepSeek-R1的1/2、Kimi-K2的1/3,但在多項標準基準測試中表現得更為出色,這得益于GLM模型的更高參數效率。在衡量模型代碼能力的SWE-benchVerified榜單上,GLM-4.5系列位于性能/參數比帕累托前沿,表明在相同規(guī)模下GLM-4.5系列實現了最佳性能。
目前,GLM-4.5擁有兩種模式:用于復雜推理和工具使用的思考模式,及用于即時響應的非思考模式。
在性能優(yōu)化之外,GLM-4.5系列也在成本和效率上實現突破,由此帶來遠低于主流模型定價:API調用價格低至輸入0.8元/百萬tokens,輸出2元/百萬tokens。
同時,高速版本實測生成速度最高可至100tokens/秒,支持低延遲、高并發(fā)的實際部署需求,兼顧成本效益與交互體驗。
體驗:在工具調用可靠性和任務完成度等方面表現突出
GLM-4.5系列能勝任全棧開發(fā)任務,編寫復雜應用、游戲、交互網頁。這得益于模型原生具備的在前端編寫網站、在后端進行數據庫管理,以及通過工具調用接口支持任意智能體應用等能力。
“做一個google搜索網站”,當用戶提出這樣一個需求,GLM-4.5會推理表示“我來幫你創(chuàng)建一個Google搜索網站。讓我先查看當前項目結構,然后開始開發(fā)”。它會先創(chuàng)建todo列表;寫前端讓用戶看到結果;再寫后端API;使用z-ai-web-dev-sdk進行搜索功能。
北青報記者看到,它會自己列出“待辦事項”,并且分步驟給出終端運行的代碼,再一步一步完成待辦事項并劃去。比如在這個過程中,它列出的代碼事項就包括1.創(chuàng)建Google搜索主頁UI-包含搜索框和Google風格布局;2.實現搜索功能的前端邏輯-處理搜索請求和結果展示;3.創(chuàng)建搜索API路由-使用z-ai-web-dev-sdk進行web搜索;4.優(yōu)化搜索結果展示-添加加載狀態(tài)和錯誤處理;5.添加搜索歷史記錄功能。最終,它成功創(chuàng)建一個功能完整的Google搜索網站,并告訴用戶該網站的特點都有什么,目前已經完全可用。
GLM-4.5讓普通人開發(fā)網頁的門檻大幅降低。除了做搜索網站外,它還可以做“一個真的能發(fā)彈幕的B站”“一個真的能發(fā)博的微博”。比如用戶自己開發(fā)了一個類似微博的網站,這并非一個“中看不中用”的擺設,而是可以真的發(fā)微博的實際可用的網站,令人驚喜。
GLM-4.5不僅擅長處理復雜代碼,同時也具有優(yōu)秀的數據精準處理、交互動畫設計能力。它可以用來做小游戲,比如前段時間流行的FlappyBird小游戲。用戶只需要簡單地說一兩句要求,它便可以在HTML上生成了。
有趣的是,GLM-4.5還可以幫助制作PPT,而且過程中會自主搜索資料、尋找配圖,根據材料以HTML形式編寫圖文,使信息更準確、排版更靈活。除了16:9的PPT,也可以制作長圖、小紅書、社交媒體封面或簡歷等多比例圖片。
開源:促進探尋下一個新的計算范式
據介紹,GLM-4.5在HuggingFace與ModelScope平臺同步開源。GLM-4.5在包含推理、代碼、智能體的綜合能力達到開源SOTA。在綜合平均分中,GLM-4.5取得了全球模型第三,國產模型第一,開源模型第一。
為何要開源?智譜首席執(zhí)行官張鵬在接受采訪時表示,智譜是國內最早進行大模型開源的AI企業(yè)之一,曾多次進行大模型開源。首先,從學術界和國家戰(zhàn)略來講,開源都是一個非常重大的戰(zhàn)略方向。其次,從企業(yè)來講,每次開源時間節(jié)點的選擇都有一些特殊考量,“我們認為在這個時間點上開源,可以促進產業(yè)界、學術界重新思考AI的發(fā)展,重新思考AGI(通用人工智能)的前景,甚至探尋下一個新的計算范式?!?/p>
截至發(fā)稿,GLM-4.5已經取得Huggingface和OpenRouter同時趨勢榜第一。
北京累計備案上線大模型132款
智譜是一家來自北京的企業(yè),從清華大學計算機系知識工程實驗室技術成果轉化而來,也是國內最早一批從事大模型研究的單位之一。
在北京,創(chuàng)新資源高度密集,這里集聚了全國超過40%的頂尖AI人才,2024年,人工智能企業(yè)數量突破2400家,核心產業(yè)規(guī)模接近3500億元,兩項指標均占全國總量的一半,成為名副其實的“人工智能第一城”。
截至目前,北京累計備案上線大模型132款,占全國近40%。聚焦大模型、具身智能、人工智能安全等方向,已經建設首批23家人工智能領域北京市重點實驗室,設立4家人工智能領域新型研發(fā)機構,在人工智能技術創(chuàng)新、應用示范等方面形成系統布局。
北京在教育、醫(yī)療、文化、交通、政務等領域有大量優(yōu)質場景,《北京市關于支持信息軟件企業(yè)加強人工智能應用服務能力行動方案》《北京市人工智能賦能新型工業(yè)化行動方案》等專項產業(yè)政策有效支持場景開放,人工智能技術與實體經濟進一步融合。
北京市科委、中關村管委會主任張繼紅表示,北京在人工智能領域的“先天優(yōu)勢”非常突出,主要有“三多”:“一是科研機構多,二是頂尖人才多,三是落地場景多,能為人工智能技術落地提供“試驗田”和高質量行業(yè)數據。在場景和空間方面,支持各區(qū)域培育特色應用,構建全域人工智能城市生態(tài)?!?/p>
北京智譜華章科技有限公司董事長劉德兵曾在接受記者采訪時表示,作為一家大模型公司,“智譜不僅致力于推動國產大模型技術的發(fā)展,也希望能為世界貢獻中國AI力量”。
文/北京青年報記者溫婧
編輯/周超
《網游之縱橫天下》游戲高手與菜鳥到底距離有多遠?
第一百九十九章小荷才露尖尖角“咦?經營得不錯嘛~~”凌雪看了看店鋪的出入清單,淺淺一笑問道:“呆子,這個店鋪是白云主城當之無愧的第一店,方位選取得實在太好了,很快的,你就會成為我們雪月的第一土財主……” 我微微一笑:“只是運氣好而已,剛好任務刷了不少聲望,所以才搶先盤下了這個店,如果是什么。
《網游之縱橫天下》一本完美無瑕的網游作品,無數書迷心中的神作
第一本:《網游之縱橫天下》簡介:我本是一個不起眼的玩家,然而真正的高手與菜鳥到底距離有多遠?當有一天,兩個漂亮女孩一起問我“你愿意當一個高手,縱橫天下嗎?”我說“我愿意!”于是乎,我悟了,便成了高手,從此縱橫天下!入坑指南:吃完晚飯,繼續(xù)上線,晚上八點鐘的時間。此時的遺忘峽谷內要安靜到此結束了?——|。
菜鳥玩家逆襲成高手,攜手美女并肩作戰(zhàn),網游中縱橫天下!
劍火龍魂哈哈一笑:“沒想到你們也放棄了月恒全部加入靈慟里來了,咱們也算是老熟人,在月恒里,劍與玫瑰和失樂園兩大中流砥柱解散之后,銀月城的西方就是咱們劍火和傲世爭霸的天下,想不到靈慟里還是一樣!”傲世狂人嘿嘿笑道:“龍魂兄,今天,純屬是我們傲世和這個人的一些私人恩怨,如果龍魂兄給面子的話,不等會說。
來源:紅網
作者:洪宗翰
編輯:張雅佩
本文為紅辣椒評論 原創(chuàng)文章,僅系作者個人觀點,不代表紅網立場。轉載請附原文出處鏈接和本聲明。