國內(nèi)大模型賽道太“卷”了。
KimiK2、MiniMaxM2、階躍星辰Step-3模型發(fā)布不到一個(gè)月,這次智譜又要發(fā)布最強(qiáng)新模型了。
7月28日消息,剛剛,智譜在全球發(fā)布新一代旗艦?zāi)P虶LM-4.5系列,這是專為AIAgent智能體應(yīng)用打造的基礎(chǔ)模型,采用混合專家(MoE)架構(gòu),在推理、代碼、智能體綜合能力達(dá)到開源模型SOTA水平。綜合平均分,GLM-4.5取得了全球模型第三、國產(chǎn)模型第一,開源模型第一,多項(xiàng)評(píng)分超越DeepSeek-R1-0528(55.9)和KimiK2(53.1)等多款模型。
此次GLM-4.5系列包括兩款產(chǎn)品:總參數(shù)量3550億、激活參數(shù)320億的GLM-4.5,以及1060億參數(shù)的GLM-4.5-Air。目前,GLM-4.5和GLM-4.5-Air已經(jīng)全面在HuggingFace與ModelScope魔搭平臺(tái)同步開源,API已上線智譜開放平臺(tái),滿血版GLM-4.5已經(jīng)可以在智譜清言、z.ai官網(wǎng)免費(fèi)體驗(yàn)。
智譜CEO張鵬早前對(duì)筆者表示,智譜依然堅(jiān)持在做行業(yè)Agent產(chǎn)品和解決方案,以及向企業(yè)提供MaaS服務(wù)。同時(shí),AGI需模型能力的全面性,人類處理復(fù)雜任務(wù)時(shí),會(huì)面對(duì)多模態(tài)與復(fù)雜交互情況,如同木桶不能有短板,對(duì)能力需求是全面性的。
“不可否認(rèn)的是,當(dāng)下AGI之路還剛剛開始,(當(dāng)前)模型的能力還無法達(dá)到完全類比人的這樣一個(gè)水平?!睆堸i曾坦言。
智譜GLM-4.5評(píng)測(cè)數(shù)據(jù)信息
據(jù)悉,智譜成立于2019年,以“讓機(jī)器像人一樣思考”為愿景,研發(fā)了具有國產(chǎn)獨(dú)立知識(shí)產(chǎn)權(quán)的GLM大模型預(yù)訓(xùn)練架構(gòu)。自2023年3月智譜AI推出千億開源基座對(duì)話模型ChatGLM系列以來,GLM大模型經(jīng)歷四個(gè)大版本迭代,共發(fā)布了超過20款A(yù)I模型技術(shù)和產(chǎn)品。
商業(yè)化方面,截至2023年底,智譜已擁有超2000家生態(tài)合作伙伴、超1000個(gè)大模型規(guī)模化應(yīng)用,另有200多家企業(yè)跟智譜AI進(jìn)行了深度共創(chuàng),智譜GLM系列大模型已在金融、醫(yī)療、教育等多個(gè)行業(yè)得到廣泛應(yīng)用;C端層面,截至2024年底,智譜清言擁有超過2500萬用戶,開始上線付費(fèi)功能,ARR(年度經(jīng)常性收入)收入超千萬元。
融資方面,今年7月,在沖擊IPO上市關(guān)口,智譜宣布獲得上海國資10億元戰(zhàn)略融資;在此之前,智譜獲得杭州城投產(chǎn)業(yè)基金、上城資本、珠海華發(fā)集團(tuán)、四川成都高新區(qū)等機(jī)構(gòu)的融資。據(jù)統(tǒng)計(jì),截至目前,智譜累計(jì)融資超百億元,投后估值超過200億元,投資方包括高瓴、啟明創(chuàng)投、君聯(lián)資本等知名投資機(jī)構(gòu),以及美團(tuán)、阿里、騰訊、小米在內(nèi)的互聯(lián)網(wǎng)公司。
智譜曾表示,2025年將是智譜的開源年,其將很快發(fā)布包括基座模型、推理模型、多模態(tài)模型、Agent等在內(nèi)的全新大模型,并將其開源。
如今,智譜終于實(shí)現(xiàn)開源最強(qiáng)模型這一目標(biāo),這得益于GLM模型的更高參數(shù)效率和強(qiáng)化訓(xùn)練流程等多種技術(shù)能力。
首先,據(jù)介紹,而GLM-4.5和GLM-4.5-Air使用了相似的訓(xùn)練流程,首先在15萬億token的通用數(shù)據(jù)上進(jìn)行了預(yù)訓(xùn)練,此后在代碼、推理、智能體等領(lǐng)域的8萬億token數(shù)據(jù)上進(jìn)行針對(duì)性訓(xùn)練,最后通過強(qiáng)化學(xué)習(xí)進(jìn)一步增強(qiáng)模型推理、代碼與智能體能力。
其次,GLM-4.5參數(shù)量?jī)H為DeepSeek-R1的50%、Kimi-K2的三分之一,但在多項(xiàng)標(biāo)準(zhǔn)基準(zhǔn)測(cè)試中表現(xiàn)得更為出色。而且,API價(jià)格僅為Claude的1/10,低至輸入每百萬tokens達(dá)0.8元,輸出每百萬tokens達(dá)2元。同時(shí),高速版本實(shí)測(cè)生成速度超過100tokens/秒,支持低延遲、高并發(fā)的實(shí)際部署需求,兼顧成本效益與交互體驗(yàn)。
最后,評(píng)測(cè)層面,GLM-4.5分為基準(zhǔn)和真實(shí)場(chǎng)景表現(xiàn)。其中,在包括MMLUPro等12個(gè)評(píng)測(cè)基準(zhǔn)中,GLM-4.5取得了優(yōu)異成績(jī),全球模型第一是OpenAIo3(65.0)、第二是xAIGrok4(63.6)、第三是GLM-4.5(63.2),超越了KimiK2(53.1)、DeepSeekR1(55.9);真實(shí)評(píng)測(cè)方面,采用52個(gè)編程開發(fā)任務(wù)當(dāng)中,GLM-4.5相對(duì)其他開源模型展現(xiàn)出競(jìng)爭(zhēng)優(yōu)勢(shì),雖然略遜于Claude-4-Sonnet,但在工具調(diào)用可靠性和任務(wù)完成度方面表現(xiàn)突出,大部分場(chǎng)景中可實(shí)現(xiàn)平替效果,編寫較為復(fù)雜的應(yīng)用、游戲、交互網(wǎng)頁等。
目前,GLM-4.5已經(jīng)對(duì)外開源。智譜稱,公司后續(xù)會(huì)發(fā)布更加詳細(xì)的技術(shù)報(bào)告。
事實(shí)上,除了智譜GLM-4.5之外,今晚阿里又發(fā)布了新的開源模型——電影級(jí)視頻生成模型通義萬相Wan2.2,可將光影、色彩、鏡頭語言三大電影美學(xué)元素裝進(jìn)模型,隨意組合60多個(gè)直觀可控的參數(shù),大幅提升電影級(jí)畫面的制作效率;而上周,阿里AI三連發(fā)——Qwen3最新版基礎(chǔ)模型(非思考版)、Qwen3推理模型和AI編程模型Qwen3-Coder,它們分別在基礎(chǔ)模型、推理模型和編程模型等主流領(lǐng)域獲得全球開源冠軍;階躍星辰則在WAIC期間發(fā)布Step3模型,是公司首個(gè)全尺寸、原生多模態(tài)推理模型,兼顧模型效果與推理成本,采用MoE架構(gòu),總參數(shù)量3210億,激活參數(shù)量380億。
據(jù)悉,OpenAI也即將釋放最強(qiáng)閉源模型GPT-5,預(yù)計(jì)最快在7月底發(fā)布,有望支持Sora2世界模型,從而實(shí)現(xiàn)多模理解一體化。
一位AI行業(yè)人士7月28日向筆者表示,隨著中國大模型越來越開源,硅谷模型轉(zhuǎn)向閉源,而國內(nèi)模型的開源對(duì)于AI行業(yè)有更多的益處。這也意味著,全球基礎(chǔ)大模型行業(yè)有望迎來新的“洗牌”。
(本文首發(fā)于鈦媒體App,作者|林志佳,編輯|蓋虹達(dá))
總裁甜文,重回人生轉(zhuǎn)折點(diǎn),緊抓住粗大腿不放手,開啟撩漢技能
小說:姐隨手撩個(gè)漢就撩到總裁了?這豪門我還真就非嫁不可啦
現(xiàn)言甜寵文,37度懶《執(zhí)手佳人》驚艷完結(jié),霸道女總裁在線撩漢