國內(nèi)大模型賽道太“卷”了。
KimiK2、MiniMaxM2、階躍星辰Step-3模型發(fā)布不到一個月,這次智譜又要發(fā)布最強(qiáng)新模型了。
7月28日消息,剛剛,智譜在全球發(fā)布新一代旗艦?zāi)P虶LM-4.5系列,這是專為AIAgent智能體應(yīng)用打造的基礎(chǔ)模型,采用混合專家(MoE)架構(gòu),在推理、代碼、智能體綜合能力達(dá)到開源模型SOTA水平。綜合平均分,GLM-4.5取得了全球模型第三、國產(chǎn)模型第一,開源模型第一,多項(xiàng)評分超越DeepSeek-R1-0528(55.9)和KimiK2(53.1)等多款模型。
此次GLM-4.5系列包括兩款產(chǎn)品:總參數(shù)量3550億、激活參數(shù)320億的GLM-4.5,以及1060億參數(shù)的GLM-4.5-Air。目前,GLM-4.5和GLM-4.5-Air已經(jīng)全面在HuggingFace與ModelScope魔搭平臺同步開源,API已上線智譜開放平臺,滿血版GLM-4.5已經(jīng)可以在智譜清言、z.ai官網(wǎng)免費(fèi)體驗(yàn)。
智譜CEO張鵬早前對筆者表示,智譜依然堅(jiān)持在做行業(yè)Agent產(chǎn)品和解決方案,以及向企業(yè)提供MaaS服務(wù)。同時,AGI需模型能力的全面性,人類處理復(fù)雜任務(wù)時,會面對多模態(tài)與復(fù)雜交互情況,如同木桶不能有短板,對能力需求是全面性的。
“不可否認(rèn)的是,當(dāng)下AGI之路還剛剛開始,(當(dāng)前)模型的能力還無法達(dá)到完全類比人的這樣一個水平。”張鵬曾坦言。
智譜GLM-4.5評測數(shù)據(jù)信息
據(jù)悉,智譜成立于2019年,以“讓機(jī)器像人一樣思考”為愿景,研發(fā)了具有國產(chǎn)獨(dú)立知識產(chǎn)權(quán)的GLM大模型預(yù)訓(xùn)練架構(gòu)。自2023年3月智譜AI推出千億開源基座對話模型ChatGLM系列以來,GLM大模型經(jīng)歷四個大版本迭代,共發(fā)布了超過20款A(yù)I模型技術(shù)和產(chǎn)品。
商業(yè)化方面,截至2023年底,智譜已擁有超2000家生態(tài)合作伙伴、超1000個大模型規(guī)?;瘧?yīng)用,另有200多家企業(yè)跟智譜AI進(jìn)行了深度共創(chuàng),智譜GLM系列大模型已在金融、醫(yī)療、教育等多個行業(yè)得到廣泛應(yīng)用;C端層面,截至2024年底,智譜清言擁有超過2500萬用戶,開始上線付費(fèi)功能,ARR(年度經(jīng)常性收入)收入超千萬元。
融資方面,今年7月,在沖擊IPO上市關(guān)口,智譜宣布獲得上海國資10億元戰(zhàn)略融資;在此之前,智譜獲得杭州城投產(chǎn)業(yè)基金、上城資本、珠海華發(fā)集團(tuán)、四川成都高新區(qū)等機(jī)構(gòu)的融資。據(jù)統(tǒng)計(jì),截至目前,智譜累計(jì)融資超百億元,投后估值超過200億元,投資方包括高瓴、啟明創(chuàng)投、君聯(lián)資本等知名投資機(jī)構(gòu),以及美團(tuán)、阿里、騰訊、小米在內(nèi)的互聯(lián)網(wǎng)公司。
智譜曾表示,2025年將是智譜的開源年,其將很快發(fā)布包括基座模型、推理模型、多模態(tài)模型、Agent等在內(nèi)的全新大模型,并將其開源。
如今,智譜終于實(shí)現(xiàn)開源最強(qiáng)模型這一目標(biāo),這得益于GLM模型的更高參數(shù)效率和強(qiáng)化訓(xùn)練流程等多種技術(shù)能力。
首先,據(jù)介紹,而GLM-4.5和GLM-4.5-Air使用了相似的訓(xùn)練流程,首先在15萬億token的通用數(shù)據(jù)上進(jìn)行了預(yù)訓(xùn)練,此后在代碼、推理、智能體等領(lǐng)域的8萬億token數(shù)據(jù)上進(jìn)行針對性訓(xùn)練,最后通過強(qiáng)化學(xué)習(xí)進(jìn)一步增強(qiáng)模型推理、代碼與智能體能力。
其次,GLM-4.5參數(shù)量僅為DeepSeek-R1的50%、Kimi-K2的三分之一,但在多項(xiàng)標(biāo)準(zhǔn)基準(zhǔn)測試中表現(xiàn)得更為出色。而且,API價格僅為Claude的1/10,低至輸入每百萬tokens達(dá)0.8元,輸出每百萬tokens達(dá)2元。同時,高速版本實(shí)測生成速度超過100tokens/秒,支持低延遲、高并發(fā)的實(shí)際部署需求,兼顧成本效益與交互體驗(yàn)。
最后,評測層面,GLM-4.5分為基準(zhǔn)和真實(shí)場景表現(xiàn)。其中,在包括MMLUPro等12個評測基準(zhǔn)中,GLM-4.5取得了優(yōu)異成績,全球模型第一是OpenAIo3(65.0)、第二是xAIGrok4(63.6)、第三是GLM-4.5(63.2),超越了KimiK2(53.1)、DeepSeekR1(55.9);真實(shí)評測方面,采用52個編程開發(fā)任務(wù)當(dāng)中,GLM-4.5相對其他開源模型展現(xiàn)出競爭優(yōu)勢,雖然略遜于Claude-4-Sonnet,但在工具調(diào)用可靠性和任務(wù)完成度方面表現(xiàn)突出,大部分場景中可實(shí)現(xiàn)平替效果,編寫較為復(fù)雜的應(yīng)用、游戲、交互網(wǎng)頁等。
目前,GLM-4.5已經(jīng)對外開源。智譜稱,公司后續(xù)會發(fā)布更加詳細(xì)的技術(shù)報告。
事實(shí)上,除了智譜GLM-4.5之外,今晚阿里又發(fā)布了新的開源模型——電影級視頻生成模型通義萬相Wan2.2,可將光影、色彩、鏡頭語言三大電影美學(xué)元素裝進(jìn)模型,隨意組合60多個直觀可控的參數(shù),大幅提升電影級畫面的制作效率;而上周,阿里AI三連發(fā)——Qwen3最新版基礎(chǔ)模型(非思考版)、Qwen3推理模型和AI編程模型Qwen3-Coder,它們分別在基礎(chǔ)模型、推理模型和編程模型等主流領(lǐng)域獲得全球開源冠軍;階躍星辰則在WAIC期間發(fā)布Step3模型,是公司首個全尺寸、原生多模態(tài)推理模型,兼顧模型效果與推理成本,采用MoE架構(gòu),總參數(shù)量3210億,激活參數(shù)量380億。
據(jù)悉,OpenAI也即將釋放最強(qiáng)閉源模型GPT-5,預(yù)計(jì)最快在7月底發(fā)布,有望支持Sora2世界模型,從而實(shí)現(xiàn)多模理解一體化。
一位AI行業(yè)人士7月28日向筆者表示,隨著中國大模型越來越開源,硅谷模型轉(zhuǎn)向閉源,而國內(nèi)模型的開源對于AI行業(yè)有更多的益處。這也意味著,全球基礎(chǔ)大模型行業(yè)有望迎來新的“洗牌”。
(本文首發(fā)于鈦媒體App,作者|林志佳,編輯|蓋虹達(dá))
離婚后她遠(yuǎn)走高飛,歸來時卻被前夫抵墻求復(fù)婚
離婚后顧總跪求復(fù)婚,蘇渺華麗回歸霸氣回應(yīng)
顧總追妻火葬場,蘇渺華麗歸來顧總求復(fù)婚