余哲維
只需說句話,它就可以幫助普通用戶做一個真實可用的“谷歌”“B站”“微博”網站,還可以幫助寫PPT、找配圖,或者生成一個可以交互的小游戲。近日,北京智譜華章科技股份有限公司(以下簡稱"智譜AI")發(fā)布其新一代旗艦大模型GLM-4.5。這是一款專為智能體應用打造的基礎模型,首次在單個模型中實現將推理、編碼和智能體能力原生融合,它能勝任全棧開發(fā)任務,編寫復雜應用、游戲、交互網頁等。據悉,GLM-4.5在高速輸出的同時API調用價格低至0.8元/百萬tokens。
專為智能體應用打造基礎模型
智能體是一種有自主行動能力,能夠思考與外部環(huán)境或工具交互的系統(tǒng)。簡單來說,它看起來像一個智能小助手,可以幫人類完成各種任務,目前各大公司都在開發(fā)AI智能體,功能與側重有所區(qū)別。此次智譜發(fā)布的大模型GLM-4.5則是一款專為智能體應用打造的基礎模型?!案鶕易约旱捏w驗發(fā)現,這款大模型的性能強大,而且便于智能體調用”,腦仁智能創(chuàng)始人汪楊告訴北青報記者,自己已經體驗了這款模型,“體感處于業(yè)內領先,接近國外最先進的模型”。
GLM-4.5首次在單個模型中實現將推理、編碼和智能體能力原生融合,以滿足智能體應用的復雜需求。也就是說,用戶只需要描述需求,GLM-4.5可以先分析推理用戶想要實現什么任務,如何實現;再根據自己的推理進行編碼,開發(fā)出適合的一整套代碼來;最后生成一個智能體,用戶又可以簡單明了地看到“跑通后”的結果。
汪楊表示,“現在在大模型應用中,智能體應用及AI編程等場景的調用量非常高,且還在持續(xù)增長。但這對于模型的綜合能力,尤其是邏輯能力要求較高?!彼硎?,因此智譜此次專門為智能體應用打造的基礎模型非常有必要,且它的開源屬性更便于私有部署,尤其對于擔心數據泄露的客戶來說。
在參數量方面,它采用混合專家(MoE)架構,包括GLM-4.5:總參數量3550億,激活參數320億;GLM-4.5-Air:總參數1060億,激活參數120億。GLM-4.5參數量為DeepSeek-R1的1/2、Kimi-K2的1/3,但在多項標準基準測試中表現得更為出色,這得益于GLM模型的更高參數效率。在衡量模型代碼能力的SWE-benchVerified榜單上,GLM-4.5系列位于性能/參數比帕累托前沿,表明在相同規(guī)模下GLM-4.5系列實現了最佳性能。
目前,GLM-4.5擁有兩種模式:用于復雜推理和工具使用的思考模式,及用于即時響應的非思考模式。
在性能優(yōu)化之外,GLM-4.5系列也在成本和效率上實現突破,由此帶來遠低于主流模型定價:API調用價格低至輸入0.8元/百萬tokens,輸出2元/百萬tokens。
同時,高速版本實測生成速度最高可至100tokens/秒,支持低延遲、高并發(fā)的實際部署需求,兼顧成本效益與交互體驗。
體驗:在工具調用可靠性和任務完成度等方面表現突出
GLM-4.5系列能勝任全棧開發(fā)任務,編寫復雜應用、游戲、交互網頁。這得益于模型原生具備的在前端編寫網站、在后端進行數據庫管理,以及通過工具調用接口支持任意智能體應用等能力。
“做一個google搜索網站”,當用戶提出這樣一個需求,GLM-4.5會推理表示“我來幫你創(chuàng)建一個Google搜索網站。讓我先查看當前項目結構,然后開始開發(fā)”。它會先創(chuàng)建todo列表;寫前端讓用戶看到結果;再寫后端API;使用z-ai-web-dev-sdk進行搜索功能。
北青報記者看到,它會自己列出“待辦事項”,并且分步驟給出終端運行的代碼,再一步一步完成待辦事項并劃去。比如在這個過程中,它列出的代碼事項就包括1.創(chuàng)建Google搜索主頁UI-包含搜索框和Google風格布局;2.實現搜索功能的前端邏輯-處理搜索請求和結果展示;3.創(chuàng)建搜索API路由-使用z-ai-web-dev-sdk進行web搜索;4.優(yōu)化搜索結果展示-添加加載狀態(tài)和錯誤處理;5.添加搜索歷史記錄功能。最終,它成功創(chuàng)建一個功能完整的Google搜索網站,并告訴用戶該網站的特點都有什么,目前已經完全可用。
GLM-4.5讓普通人開發(fā)網頁的門檻大幅降低。除了做搜索網站外,它還可以做“一個真的能發(fā)彈幕的B站”“一個真的能發(fā)博的微博”。比如用戶自己開發(fā)了一個類似微博的網站,這并非一個“中看不中用”的擺設,而是可以真的發(fā)微博的實際可用的網站,令人驚喜。
GLM-4.5不僅擅長處理復雜代碼,同時也具有優(yōu)秀的數據精準處理、交互動畫設計能力。它可以用來做小游戲,比如前段時間流行的FlappyBird小游戲。用戶只需要簡單地說一兩句要求,它便可以在HTML上生成了。
有趣的是,GLM-4.5還可以幫助制作PPT,而且過程中會自主搜索資料、尋找配圖,根據材料以HTML形式編寫圖文,使信息更準確、排版更靈活。除了16:9的PPT,也可以制作長圖、小紅書、社交媒體封面或簡歷等多比例圖片。
開源:促進探尋下一個新的計算范式
據介紹,GLM-4.5在HuggingFace與ModelScope平臺同步開源。GLM-4.5在包含推理、代碼、智能體的綜合能力達到開源SOTA。在綜合平均分中,GLM-4.5取得了全球模型第三,國產模型第一,開源模型第一。
為何要開源?智譜首席執(zhí)行官張鵬在接受采訪時表示,智譜是國內最早進行大模型開源的AI企業(yè)之一,曾多次進行大模型開源。首先,從學術界和國家戰(zhàn)略來講,開源都是一個非常重大的戰(zhàn)略方向。其次,從企業(yè)來講,每次開源時間節(jié)點的選擇都有一些特殊考量,“我們認為在這個時間點上開源,可以促進產業(yè)界、學術界重新思考AI的發(fā)展,重新思考AGI(通用人工智能)的前景,甚至探尋下一個新的計算范式?!?/p>
截至發(fā)稿,GLM-4.5已經取得Huggingface和OpenRouter同時趨勢榜第一。
北京累計備案上線大模型132款
智譜是一家來自北京的企業(yè),從清華大學計算機系知識工程實驗室技術成果轉化而來,也是國內最早一批從事大模型研究的單位之一。
在北京,創(chuàng)新資源高度密集,這里集聚了全國超過40%的頂尖AI人才,2024年,人工智能企業(yè)數量突破2400家,核心產業(yè)規(guī)模接近3500億元,兩項指標均占全國總量的一半,成為名副其實的“人工智能第一城”。
截至目前,北京累計備案上線大模型132款,占全國近40%。聚焦大模型、具身智能、人工智能安全等方向,已經建設首批23家人工智能領域北京市重點實驗室,設立4家人工智能領域新型研發(fā)機構,在人工智能技術創(chuàng)新、應用示范等方面形成系統(tǒng)布局。
北京在教育、醫(yī)療、文化、交通、政務等領域有大量優(yōu)質場景,《北京市關于支持信息軟件企業(yè)加強人工智能應用服務能力行動方案》《北京市人工智能賦能新型工業(yè)化行動方案》等專項產業(yè)政策有效支持場景開放,人工智能技術與實體經濟進一步融合。
北京市科委、中關村管委會主任張繼紅表示,北京在人工智能領域的“先天優(yōu)勢”非常突出,主要有“三多”:“一是科研機構多,二是頂尖人才多,三是落地場景多,能為人工智能技術落地提供“試驗田”和高質量行業(yè)數據。在場景和空間方面,支持各區(qū)域培育特色應用,構建全域人工智能城市生態(tài)?!?/p>
北京智譜華章科技有限公司董事長劉德兵曾在接受記者采訪時表示,作為一家大模型公司,“智譜不僅致力于推動國產大模型技術的發(fā)展,也希望能為世界貢獻中國AI力量”。
文/北京青年報記者溫婧
編輯/周超
盤點會說話的肘子的五部經典小說,喜歡肘子的書友可以了解一下!
《英雄聯盟之災變時代》作者:會說話的肘子第一章我玩的是神僧,爾等是瞎子打了一天一夜單子了,呂塵是一名代練。然而呂塵眼前的世界忽然暗了下來像是一面鏡子一樣開始破碎,正在操作的鼠標、正在注視的電腦屏幕,統(tǒng)統(tǒng)破碎了,他的腦袋開始劇烈的疼痛——-。然而在破碎之后卻是一個新的世界,呂塵預感自己似乎莫名其秒說完了。
會說話肘子LOL老書,八年半萬訂,瑞根南瓜新書!
今日推薦:《英雄聯盟之災變時代》作者:會說話的肘子。點擊文末超鏈接開始觀看吧~一百一十一章西北軍新聞!“也許界碑里其他人需要呢?”阮成看了這名成員一眼,有些話他不適合當著成員的面說,說出來會讓人有些心涼|。他心里的話是:如果呂塵把破敗給了其他成員,那其他成員在得到這么強力的傳奇級裝備后,會到此結束了?。
LOL大神穿越末世,英雄技能變超能力,災變時代他能否獨領風騷?
今天,小海就給大家說一說一位新晉的網絡文學大神作家,那就是會說話的肘子!說人名大家或許不知道,那說道他的書大家肯定就聽說過!1《英雄聯盟之災變時代》應該是肘子的處女作,在設定上有點腦洞。主角重生的世界,玩擼啊擼厲害,現實中也牛掰,現實中學習繼承擼啊擼英雄的技能,對抗人類的敵人|。主角因為記著地球上到此結束了?-_。
來源:紅網
作者:李建弘
編輯:劉星峰
本文為紅辣椒評論 原創(chuàng)文章,僅系作者個人觀點,不代表紅網立場。轉載請附原文出處鏈接和本聲明。