國內(nèi)大模型賽道太“卷”了。
KimiK2、MiniMaxM2、階躍星辰Step-3模型發(fā)布不到一個月,這次智譜又要發(fā)布最強新模型了。
7月28日消息,剛剛,智譜在全球發(fā)布新一代旗艦模型GLM-4.5系列,這是專為AIAgent智能體應用打造的基礎(chǔ)模型,采用混合專家(MoE)架構(gòu),在推理、代碼、智能體綜合能力達到開源模型SOTA水平。綜合平均分,GLM-4.5取得了全球模型第三、國產(chǎn)模型第一,開源模型第一,多項評分超越DeepSeek-R1-0528(55.9)和KimiK2(53.1)等多款模型。
此次GLM-4.5系列包括兩款產(chǎn)品:總參數(shù)量3550億、激活參數(shù)320億的GLM-4.5,以及1060億參數(shù)的GLM-4.5-Air。目前,GLM-4.5和GLM-4.5-Air已經(jīng)全面在HuggingFace與ModelScope魔搭平臺同步開源,API已上線智譜開放平臺,滿血版GLM-4.5已經(jīng)可以在智譜清言、z.ai官網(wǎng)免費體驗。
智譜CEO張鵬早前對筆者表示,智譜依然堅持在做行業(yè)Agent產(chǎn)品和解決方案,以及向企業(yè)提供MaaS服務(wù)。同時,AGI需模型能力的全面性,人類處理復雜任務(wù)時,會面對多模態(tài)與復雜交互情況,如同木桶不能有短板,對能力需求是全面性的。
“不可否認的是,當下AGI之路還剛剛開始,(當前)模型的能力還無法達到完全類比人的這樣一個水平?!睆堸i曾坦言。
智譜GLM-4.5評測數(shù)據(jù)信息
據(jù)悉,智譜成立于2019年,以“讓機器像人一樣思考”為愿景,研發(fā)了具有國產(chǎn)獨立知識產(chǎn)權(quán)的GLM大模型預訓練架構(gòu)。自2023年3月智譜AI推出千億開源基座對話模型ChatGLM系列以來,GLM大模型經(jīng)歷四個大版本迭代,共發(fā)布了超過20款AI模型技術(shù)和產(chǎn)品。
商業(yè)化方面,截至2023年底,智譜已擁有超2000家生態(tài)合作伙伴、超1000個大模型規(guī)?;瘧?,另有200多家企業(yè)跟智譜AI進行了深度共創(chuàng),智譜GLM系列大模型已在金融、醫(yī)療、教育等多個行業(yè)得到廣泛應用;C端層面,截至2024年底,智譜清言擁有超過2500萬用戶,開始上線付費功能,ARR(年度經(jīng)常性收入)收入超千萬元。
融資方面,今年7月,在沖擊IPO上市關(guān)口,智譜宣布獲得上海國資10億元戰(zhàn)略融資;在此之前,智譜獲得杭州城投產(chǎn)業(yè)基金、上城資本、珠海華發(fā)集團、四川成都高新區(qū)等機構(gòu)的融資。據(jù)統(tǒng)計,截至目前,智譜累計融資超百億元,投后估值超過200億元,投資方包括高瓴、啟明創(chuàng)投、君聯(lián)資本等知名投資機構(gòu),以及美團、阿里、騰訊、小米在內(nèi)的互聯(lián)網(wǎng)公司。
智譜曾表示,2025年將是智譜的開源年,其將很快發(fā)布包括基座模型、推理模型、多模態(tài)模型、Agent等在內(nèi)的全新大模型,并將其開源。
如今,智譜終于實現(xiàn)開源最強模型這一目標,這得益于GLM模型的更高參數(shù)效率和強化訓練流程等多種技術(shù)能力。
首先,據(jù)介紹,而GLM-4.5和GLM-4.5-Air使用了相似的訓練流程,首先在15萬億token的通用數(shù)據(jù)上進行了預訓練,此后在代碼、推理、智能體等領(lǐng)域的8萬億token數(shù)據(jù)上進行針對性訓練,最后通過強化學習進一步增強模型推理、代碼與智能體能力。
其次,GLM-4.5參數(shù)量僅為DeepSeek-R1的50%、Kimi-K2的三分之一,但在多項標準基準測試中表現(xiàn)得更為出色。而且,API價格僅為Claude的1/10,低至輸入每百萬tokens達0.8元,輸出每百萬tokens達2元。同時,高速版本實測生成速度超過100tokens/秒,支持低延遲、高并發(fā)的實際部署需求,兼顧成本效益與交互體驗。
最后,評測層面,GLM-4.5分為基準和真實場景表現(xiàn)。其中,在包括MMLUPro等12個評測基準中,GLM-4.5取得了優(yōu)異成績,全球模型第一是OpenAIo3(65.0)、第二是xAIGrok4(63.6)、第三是GLM-4.5(63.2),超越了KimiK2(53.1)、DeepSeekR1(55.9);真實評測方面,采用52個編程開發(fā)任務(wù)當中,GLM-4.5相對其他開源模型展現(xiàn)出競爭優(yōu)勢,雖然略遜于Claude-4-Sonnet,但在工具調(diào)用可靠性和任務(wù)完成度方面表現(xiàn)突出,大部分場景中可實現(xiàn)平替效果,編寫較為復雜的應用、游戲、交互網(wǎng)頁等。
目前,GLM-4.5已經(jīng)對外開源。智譜稱,公司后續(xù)會發(fā)布更加詳細的技術(shù)報告。
事實上,除了智譜GLM-4.5之外,今晚阿里又發(fā)布了新的開源模型——電影級視頻生成模型通義萬相Wan2.2,可將光影、色彩、鏡頭語言三大電影美學元素裝進模型,隨意組合60多個直觀可控的參數(shù),大幅提升電影級畫面的制作效率;而上周,阿里AI三連發(fā)——Qwen3最新版基礎(chǔ)模型(非思考版)、Qwen3推理模型和AI編程模型Qwen3-Coder,它們分別在基礎(chǔ)模型、推理模型和編程模型等主流領(lǐng)域獲得全球開源冠軍;階躍星辰則在WAIC期間發(fā)布Step3模型,是公司首個全尺寸、原生多模態(tài)推理模型,兼顧模型效果與推理成本,采用MoE架構(gòu),總參數(shù)量3210億,激活參數(shù)量380億。
據(jù)悉,OpenAI也即將釋放最強閉源模型GPT-5,預計最快在7月底發(fā)布,有望支持Sora2世界模型,從而實現(xiàn)多模理解一體化。
一位AI行業(yè)人士7月28日向筆者表示,隨著中國大模型越來越開源,硅谷模型轉(zhuǎn)向閉源,而國內(nèi)模型的開源對于AI行業(yè)有更多的益處。這也意味著,全球基礎(chǔ)大模型行業(yè)有望迎來新的“洗牌”。
(本文首發(fā)于鈦媒體App,作者|林志佳,編輯|蓋虹達)
小說:隱婚五年未見夫,再見竟是逼她離婚,哪料前夫竟賴上她了
言情小說《隱婚前夫:離婚請簽字》何以能撩到常年單身的你
小說:隱婚五年未見夫,再遇讓打離婚官司,簽字后前夫天天來糾纏
免責聲明:本文內(nèi)容由開放的智能模型自動生成,僅供參考。