來(lái)源:環(huán)球時(shí)報(bào)
【環(huán)球時(shí)報(bào)報(bào)道記者劉揚(yáng)胡雨薇】編者的話:中國(guó)又一款大模型宣布開(kāi)源!此次推出新模型的是曾被美國(guó)AI巨頭OpenAI點(diǎn)名的競(jìng)爭(zhēng)對(duì)手中國(guó)AI企業(yè)智譜。該公司于28日晚正式發(fā)布新一代旗艦大模型GLM-4.5,這是一款專為智能體應(yīng)用打造的基礎(chǔ)模型,在復(fù)雜推理、代碼生成及智能體交互等通用能力上實(shí)現(xiàn)能力融合與技術(shù)突破,綜合測(cè)試性能已躋身全球領(lǐng)先行列。美國(guó)科技網(wǎng)站Techi認(rèn)為,中國(guó)AI發(fā)展正清晰呈現(xiàn)“易獲取”的趨勢(shì):“智譜不僅在追趕深度求索、OpenAI等行業(yè)巨頭,更在努力與之同臺(tái)競(jìng)技”。針對(duì)這款國(guó)產(chǎn)大模型具有哪些最新的特點(diǎn)與突破、為何要全面開(kāi)源、此舉對(duì)中國(guó)大模型發(fā)展的影響等話題,《環(huán)球時(shí)報(bào)》記者28日專訪了智譜首席執(zhí)行官?gòu)堸i。
“全球第三、國(guó)產(chǎn)第一、開(kāi)源第一”
中國(guó)AI企業(yè)智譜28日晚官宣的大模型性能要點(diǎn)如下:新一代旗艦大模型GLM-4.5在包含推理、代碼、智能體等方面的綜合能力達(dá)到開(kāi)源SOTA(意為“當(dāng)前最佳技術(shù)”或“最前沿水平”);為綜合衡量模型的通用能力,該研制團(tuán)隊(duì)選擇最具代表性的12個(gè)評(píng)測(cè)基準(zhǔn),在綜合平均分中,GLM-4.5取得了全球模型第三、國(guó)產(chǎn)模型第一、開(kāi)源模型第一。用戶可通過(guò)智譜大模型開(kāi)放平臺(tái)使用該模型,其開(kāi)源版本也將同步登陸Hugging-Face與ModelScope平臺(tái)。
這款新模型的發(fā)布,代表了AI發(fā)展方向的一次重要轉(zhuǎn)變。它不再滿足于扮演一個(gè)被動(dòng)回答問(wèn)題的“聊天機(jī)器人”,而是要成為能夠理解復(fù)雜目標(biāo)、自主規(guī)劃并執(zhí)行多步驟任務(wù)的“AI員工”,可以完整執(zhí)行一些任務(wù)。例如,用戶通過(guò)該公司網(wǎng)站使用大模型時(shí),僅用一句簡(jiǎn)單的指令,就可讓GLM-4.5獨(dú)立開(kāi)發(fā)出具備搜索功能的“谷歌”網(wǎng)站、可以發(fā)彈幕的“B站”,甚至直接上線一個(gè)完整的“FlappyBird”小游戲。
中國(guó)人工智能的發(fā)展正受到世界矚目。
據(jù)《環(huán)球時(shí)報(bào)》記者了解,GLM-4.5和GLM-4.5-Air使用了相似的訓(xùn)練流程:首先在15萬(wàn)億token的通用數(shù)據(jù)上進(jìn)行了預(yù)訓(xùn)練,此后在代碼、推理、智能體等領(lǐng)域的8萬(wàn)億token數(shù)據(jù)上進(jìn)行針對(duì)性訓(xùn)練,最后通過(guò)強(qiáng)化學(xué)習(xí)進(jìn)一步增強(qiáng)模型推理、代碼與智能體能力。GLM-4.5參數(shù)量為DeepSeek-R1的1/2、Kimi-K2的1/3,但在多項(xiàng)標(biāo)準(zhǔn)基準(zhǔn)測(cè)試中表現(xiàn)得更為出色,這得益于GLM模型的更高參數(shù)效率。
智譜旗艦大模型發(fā)布僅10小時(shí),便引發(fā)全球媒體關(guān)注。外媒報(bào)道普遍聚焦該模型“成本更低、性能更優(yōu)”的特性,部分媒體還對(duì)其參數(shù)進(jìn)行了詳細(xì)解析與同類對(duì)比。目前該系列模型API調(diào)用價(jià)格低至輸入0.8元/百萬(wàn)tokens、輸出2元/百萬(wàn)tokens;高速版最高可達(dá)100tokens/秒。
28日發(fā)布模型后不到兩個(gè)小時(shí),X平臺(tái)就在首頁(yè)推薦了GLM-4.5這款中國(guó)大模型。發(fā)布12小時(shí)后,它已經(jīng)位列國(guó)際開(kāi)源社區(qū)Hugging-Face榜單全球第二,創(chuàng)增速紀(jì)錄。
美國(guó)消費(fèi)者新聞與商業(yè)頻道(CNBC)網(wǎng)站28日稱:“中國(guó)企業(yè)正在研發(fā)的人工智能模型不僅智能化水平提升,使用成本也持續(xù)降低,這與深度求索(DeepSeek)當(dāng)年震動(dòng)市場(chǎng)的核心突破優(yōu)勢(shì)相呼應(yīng)?!?/p>
印度財(cái)經(jīng)媒體MINT則在報(bào)道中評(píng)價(jià)稱:“GLM-4.5的發(fā)布,正值中國(guó)AI初創(chuàng)企業(yè)活躍度不斷提升的階段——在這個(gè)長(zhǎng)期由美國(guó)企業(yè)主導(dǎo)的領(lǐng)域,眾多中國(guó)初創(chuàng)企業(yè)正全力提升市場(chǎng)知名度與行業(yè)認(rèn)可度。更強(qiáng)大、更易獲取的模型持續(xù)推出,或?qū)閲?guó)內(nèi)外AI競(jìng)爭(zhēng)注入新動(dòng)能?!?/p>
路透社28日在報(bào)道中提到,作為中國(guó)“AI六小虎”之一的智譜,自今年6月被OpenAI“點(diǎn)名”后便備受關(guān)注。彭博社也在當(dāng)日?qǐng)?bào)道中稱,OpenAI挑戰(zhàn)者智譜AI發(fā)布全新開(kāi)源模型,試圖在這個(gè)蓬勃發(fā)展的行業(yè)中搶占制高點(diǎn),為未來(lái)技術(shù)進(jìn)步樹(shù)立行業(yè)標(biāo)準(zhǔn)。另一家美國(guó)知名科技媒體VentureBeat則在報(bào)道中提到:“GLM-4.5的發(fā)布為企業(yè)團(tuán)隊(duì)提供了一個(gè)可行的、高性能的基礎(chǔ)模型。對(duì)于平衡創(chuàng)新、績(jī)效和運(yùn)營(yíng)限制的團(tuán)隊(duì)來(lái)說(shuō),這是一個(gè)令人信服的選擇?!庇《让襟wDataRequest的報(bào)道稱:“這家脫胎于清華大學(xué)的企業(yè)持續(xù)拓展通用語(yǔ)言模型(GLM)系列,旨在讓先進(jìn)AI技術(shù)更易獲取。這標(biāo)志著人工智能系統(tǒng)向更高自主性邁出了重要一步。進(jìn)一步鞏固了其作為OpenAI等全球玩家競(jìng)爭(zhēng)對(duì)手的地位。”美國(guó)科技網(wǎng)站Techi認(rèn)為,隨著更多企業(yè)推出開(kāi)源模型并壓低價(jià)格,中國(guó)正逐步成為全球AI競(jìng)爭(zhēng)的核心參與者,力爭(zhēng)占據(jù)領(lǐng)先地位。未來(lái)幾個(gè)月,這些快速變化將帶來(lái)何種影響——是催生新的監(jiān)管政策,還是推動(dòng)新的技術(shù)創(chuàng)新,仍有待觀察。
除了智譜旗艦大模型的性能,美國(guó)媒體還對(duì)中國(guó)AI產(chǎn)業(yè)界在世界人工智能大會(huì)期間的重大舉措保持關(guān)注。美國(guó)CNBC網(wǎng)站28日另一篇文章稱,中國(guó)人工智能公司日前宣布成立兩家新的產(chǎn)業(yè)聯(lián)盟,旨在發(fā)展國(guó)內(nèi)生態(tài)系統(tǒng),減少對(duì)外國(guó)技術(shù)的依賴,以應(yīng)對(duì)美國(guó)對(duì)先進(jìn)芯片出口的限制。
“中國(guó)開(kāi)源大模型浪潮的一部分”
受到外界高度關(guān)注的除了這款國(guó)產(chǎn)大模型的性能,還有一個(gè)亮點(diǎn)就是本次將旗艦?zāi)P鸵宰罡唛_(kāi)放協(xié)議MIT協(xié)議進(jìn)行全面開(kāi)源的態(tài)勢(shì)。為什么要選擇在這個(gè)節(jié)點(diǎn)進(jìn)行全面開(kāi)源?開(kāi)源策略又將對(duì)中國(guó)國(guó)產(chǎn)大模型的未來(lái)發(fā)展帶來(lái)哪些深刻影響?
智譜首席執(zhí)行官?gòu)堸i28日接受《環(huán)球時(shí)報(bào)》記者專訪時(shí)表示,智譜是國(guó)內(nèi)最早進(jìn)行大模型開(kāi)源的AI企業(yè)之一,曾多次進(jìn)行大模型開(kāi)源。2022年,該公司曾把千億基座模型開(kāi)源,當(dāng)時(shí)在全球引起廣泛關(guān)注,包括蘋果、OpenAI在內(nèi)的全球頭部企業(yè)紛紛下載進(jìn)行對(duì)比分析。2023年初,ChatGPT開(kāi)始流行時(shí),智譜又開(kāi)源了一個(gè)6B的模型,可以直接在筆記本電腦運(yùn)行。之后,更多國(guó)內(nèi)企業(yè)開(kāi)始嘗試用開(kāi)源策略,公眾也對(duì)開(kāi)源有了更多的了解。
談到此次開(kāi)源出于哪些考量,張鵬表示,首先,從學(xué)術(shù)界和國(guó)家戰(zhàn)略來(lái)講,開(kāi)源都是一個(gè)非常重大的戰(zhàn)略方向。其次,從企業(yè)來(lái)講,每次開(kāi)源時(shí)間節(jié)點(diǎn)的選擇都有一些特殊考量,“我們認(rèn)為在這個(gè)時(shí)間點(diǎn)上開(kāi)源,可以促進(jìn)產(chǎn)業(yè)界、學(xué)術(shù)界重新思考AI的發(fā)展,重新思考AGI(通用人工智能)的前景,甚至探尋下一個(gè)新的計(jì)算范式?!?/p>
多家國(guó)外科技類網(wǎng)站將智譜此次全面開(kāi)源看作是“中國(guó)開(kāi)源大模型浪潮的一部分”。美國(guó)科技媒體VentureBeat28日的文章稱,GLM-4.5的發(fā)布正值中國(guó)開(kāi)源模型競(jìng)爭(zhēng)激烈的時(shí)期,其中最引人注目的是阿里巴巴Qwen團(tuán)隊(duì)的模型。在短短幾天內(nèi),Qwen發(fā)布了4個(gè)新的開(kāi)源大語(yǔ)言模型,其中包括專注于推理的版本,目前在多項(xiàng)推理基準(zhǔn)測(cè)試中,已經(jīng)超越或追平了OpenAI的o4-mini和谷歌的Gemini2.5Pro等先進(jìn)模型。
7月28日晚,繼上周三連發(fā)后,阿里巴巴又推出新的開(kāi)源模型——電影級(jí)視頻生成模型通義萬(wàn)相Wan2.2。
下一個(gè)范式:成為“全優(yōu)生”
一些西方媒體總是試圖給智譜貼上“中國(guó)的OpenAI”等標(biāo)簽,這家中國(guó)AI企業(yè)與美國(guó)OpenAI公司發(fā)展路徑和思路有哪些異同之處?
張鵬表示,第一個(gè)相似點(diǎn)是雙方都在各自國(guó)家較早地開(kāi)始訓(xùn)練大模型。OpenAI成立后,于2018年開(kāi)始訓(xùn)練大模型,最早也是產(chǎn)學(xué)研結(jié)合,很多斯坦福的學(xué)生在OpenAI做研究。智譜2018年從清華孵化出來(lái),2019年研究大模型方向,到2020年訓(xùn)練第一個(gè)模型,比OpenAI晚了一些,但在國(guó)內(nèi)是最早的。張鵬提到:“2020年我們訓(xùn)練模型的時(shí)候,國(guó)內(nèi)好多人不理解,為什么非得訓(xùn)練一個(gè)百億、千億級(jí)的通用模型?當(dāng)時(shí)國(guó)內(nèi)還是倡導(dǎo)訓(xùn)練小模型,一個(gè)億參數(shù)就可以做特定任務(wù)?!?/p>
第二個(gè)相似點(diǎn)是雙方都努力探索不同方向的能力邊界?!按蠹叶疾恢廊斯ぶ悄艿倪吔绲降自谀睦?。OpenAI在2023年后探索了很多方向,比如o系列模型。我們也在探索各種各樣的模型,例如我們此次發(fā)布的首個(gè)原生融合模型,就代表行業(yè)一個(gè)新的發(fā)展方向。”他介紹說(shuō),現(xiàn)有模型仍然算不上真正的通用模型:有些擅長(zhǎng)編程,有些精于數(shù)學(xué),有些在推理方面表現(xiàn)出色,但沒(méi)有一個(gè)能在所有任務(wù)上都達(dá)到最佳表現(xiàn)。GLM-4.5正是朝著統(tǒng)一各種能力這一目標(biāo)努力,力求在一個(gè)模型中集成所有這些不同的能力。大模型的下一個(gè)范式,一定是把各種能力整合到一起,成為一個(gè)“全優(yōu)生”,就像人一樣,擁有越來(lái)越通用的能力。
張鵬表示,到今天,全球AI頭部企業(yè)可能慢慢也在達(dá)成一定的共識(shí)。首先,基座模型是非常重要的,“我覺(jué)得這一點(diǎn)上我們跟OpenAI有共通之處。但也有一些不一樣的點(diǎn),我們不像OpenAI那樣全封閉,而是用開(kāi)放的思路發(fā)展科學(xué)、發(fā)展技術(shù),帶動(dòng)產(chǎn)學(xué)研合作,在我們最強(qiáng)的基座模型方面,專注于讓它的能力不斷提升?!?/p>
探尋AI能力上限
美國(guó)日前剛公布了被外界稱為“AI版星球大戰(zhàn)”的“AI行動(dòng)計(jì)劃”,它可能會(huì)對(duì)中美AI競(jìng)爭(zhēng)格局以及全球AI發(fā)展帶來(lái)怎樣的影響?
張鵬表示,從某種角度來(lái)看,美國(guó)這種強(qiáng)化自身AI領(lǐng)域優(yōu)勢(shì)的策略與思路,延續(xù)之前的“星際之門”,加大國(guó)家級(jí)的重投入,這可能會(huì)催生一種新的競(jìng)爭(zhēng)。另一方面,AI發(fā)展到今天,本質(zhì)還是在探索AGI的能力上限,甚至沒(méi)有辦法提前預(yù)知要投入多少成本。如果我們不努力,就要面臨被落下的風(fēng)險(xiǎn)。但參與這種競(jìng)爭(zhēng),成本又比較大。這確實(shí)考驗(yàn)整體戰(zhàn)略:應(yīng)該花多大力氣制定一個(gè)什么樣的方案,并且能夠讓產(chǎn)學(xué)研的人員都加入其中,一起瞄著AI能力上限去努力。
對(duì)于智譜的發(fā)展愿景,張鵬認(rèn)為,未來(lái)首先要增強(qiáng)對(duì)于AGI技術(shù)發(fā)展方向的認(rèn)知,保持對(duì)AGI未來(lái)態(tài)勢(shì)的關(guān)注,而不是只關(guān)注眼前。第二個(gè)就是探索智能的上限,并且在探索能力上限的過(guò)程中,找到什么是AI真正的應(yīng)用場(chǎng)景。
張鵬認(rèn)為,從算法的角度看,下一個(gè)AI的范式能不能踩中,是不是第一個(gè)提出來(lái)的,是智譜在整個(gè)發(fā)展路徑上必須關(guān)注的事情?!芭c全球科學(xué)家一起探索科學(xué)邊界,以及為滿足中國(guó)AI發(fā)展需求做一些正確的事情,這是我們對(duì)未來(lái)發(fā)展的一個(gè)定位?!?/p>