作者|董道力郵箱|dongdaoli@pingwest.com
作者|周一笑郵箱|zhouyixiao@pingwest.com
一場(chǎng)關(guān)于全球AI開源領(lǐng)導(dǎo)權(quán)的牌局正在被重塑。就在世界剛剛習(xí)慣將中國(guó)頂級(jí)開源模型的崛起稱為新的“DeepSeek時(shí)刻”時(shí),隨著近一個(gè)月KimiK2與GLM-4.5的相繼發(fā)布,一個(gè)由“兩京兩杭”四家公司組成的中國(guó)AI開源力量,正成為牌桌上最不容忽視的玩家。在北京,是智譜AI與月之暗面;在杭州,則是阿里巴巴通義實(shí)驗(yàn)室與深度求索。而老牌勁旅智譜此次發(fā)布的GLM-4.5,正是這個(gè)“四杰爭(zhēng)雄”新時(shí)代中,一次關(guān)鍵的技術(shù)范式宣言。
這股被全球AI領(lǐng)軍人物吳恩達(dá)(AndrewNg)稱為“擁有巨大發(fā)展勢(shì)頭”的力量,其核心正是這四家公司。吳恩達(dá)近期發(fā)文明確指出,盡管美國(guó)在頂尖閉源模型上保持優(yōu)勢(shì),但在開源領(lǐng)域,中國(guó)的DeepSeekR1、KimiK2、Qwen3和GLM-4.5等模型已經(jīng)領(lǐng)先于美國(guó)最好的開源產(chǎn)品。
吳恩達(dá)的認(rèn)為,在開源AI賽道,中國(guó)的“四杰”已經(jīng)實(shí)現(xiàn)了對(duì)美國(guó)頂尖選手的反超。
這股力量的背后,出現(xiàn)了一個(gè)有趣的對(duì)比,當(dāng)一些海外的頭部模型日趨“Close”,中國(guó)的“OpenAI們”卻在集體負(fù)責(zé)“Open”。這種開放姿態(tài)進(jìn)一步降低了全球開發(fā)者的創(chuàng)新門檻,客觀上加速了AI技術(shù)的普及與迭代。
國(guó)際開源社區(qū)排前10名的模型,9個(gè)來自中國(guó),另外1個(gè)也是華人團(tuán)隊(duì)
硅谷Benchmark風(fēng)投公司合伙人BillGurley發(fā)文表示,中國(guó)開放AI模型所產(chǎn)生的組合效應(yīng)非常強(qiáng)大,模型之間都可以互相改進(jìn),新模型的推出也更容易。一位AI創(chuàng)業(yè)者則評(píng)論稱,這是一種軟實(shí)力的新杠桿。這種復(fù)雜的情緒,也體現(xiàn)在OpenAI于6月底一份關(guān)于中國(guó)AI的研究中,其中便點(diǎn)名了智譜。
當(dāng)然,隨之而來的也是挑戰(zhàn)。就在中國(guó)“開源四杰”集體發(fā)力之時(shí),作為曾經(jīng)的開源之光,Meta創(chuàng)始人扎克伯格近期發(fā)文宣布,Meta將不再開源所有“超級(jí)智能”AI模型,理由是“超級(jí)智能將帶來新的安全擔(dān)憂,我們需要謹(jǐn)慎選擇開源什么”。
這標(biāo)志著曾經(jīng)高舉開源大旗的Meta正式告別全面開源路線?;叵肴ツ?,扎克伯格還將Llama系列開放模型視為對(duì)抗OpenAI的核心武器,聲稱“開源不會(huì)削弱我們的收入、可持續(xù)性或研究投資能力”。如今的轉(zhuǎn)向,恰恰映射出當(dāng)前全球AI發(fā)展的分化,硅谷巨頭們?cè)诟?jìng)爭(zhēng)壓力下重新?lián)肀Х忾]模式時(shí),中國(guó)的AI公司卻在集體負(fù)責(zé)“Open”。
兩種截然不同的戰(zhàn)略選擇,不僅讓人思考在AI安全與創(chuàng)新開放之間究竟如何找到最優(yōu)平衡,更重要的是,未來全球AI的話語(yǔ)權(quán),會(huì)因?yàn)檫@種路線分化而發(fā)生怎樣的變化?
在這種路線分化的背景下,回到智譜GLM-4.5的發(fā)布上,其在技術(shù)范式上的價(jià)值或許被低估了。官方稱這是其首個(gè)采用“原生智能體”架構(gòu)的基礎(chǔ)模型,意味著推理、感知和執(zhí)行等核心能力被直接構(gòu)建在模型內(nèi)部。這種設(shè)計(jì)的出現(xiàn),本身就展現(xiàn)了“基座模型”下一步進(jìn)化的可能性。為了驗(yàn)證它在真實(shí)場(chǎng)景下的表現(xiàn),我們對(duì)其進(jìn)行了五項(xiàng)深度測(cè)試。
為了驗(yàn)證GLM-4.5在真實(shí)場(chǎng)景下的表現(xiàn),我們進(jìn)行了五項(xiàng)深度測(cè)試。
1
實(shí)測(cè):5大場(chǎng)景深度驗(yàn)證
測(cè)試1:一句話生成多功能網(wǎng)站
prompts:“創(chuàng)建一個(gè)在線番茄鐘網(wǎng)站,包含倒計(jì)時(shí)、任務(wù)列表、白噪音功能,使用TailwindCSS和原生JS實(shí)現(xiàn)。”
我們先選擇了一個(gè)難度不是太大的任務(wù)生成網(wǎng)頁(yè),但同時(shí)也留了一些坑,比如只提出了核心功能,如做一個(gè)番茄時(shí)鐘功能,并沒有指定番茄時(shí)鐘計(jì)時(shí)是25分鐘;提出要做任務(wù)列表功能,但沒寫清楚任務(wù)列表要能增加、刪除、完成等。
從實(shí)際情況來看,GLM-4.5不但完成了我們指令中的核心功能,還補(bǔ)全了時(shí)間暫停、時(shí)間重置、音量調(diào)整等,可以說,GLM-4.5展現(xiàn)了對(duì)場(chǎng)景細(xì)節(jié)的深度理解。尤其是白噪音功能,GLM-4.5自動(dòng)調(diào)用WebAudioAPI,并設(shè)計(jì)了雨聲、海浪、森林、篝火4種選項(xiàng)。
而且在實(shí)際體驗(yàn)過程中,GLM-4.5從指令接收解析,到完整代碼的輸出實(shí)現(xiàn),全程順暢無阻,模型對(duì)功能的理解精準(zhǔn)無誤,完全無需二次溝通確認(rèn)。頁(yè)面交互體驗(yàn)更是自然流暢,靜態(tài)頁(yè)面設(shè)計(jì)與動(dòng)態(tài)功能效果無縫銜接,真正做到了一鍵上線即可供用戶正常使用,整個(gè)開發(fā)過程高效且優(yōu)質(zhì)。
項(xiàng)目地址:https://chat.z.ai/s/cea2111d-de9c-40e7-8835-ad4c0cbc4716
測(cè)試2:生成PPT
prompts:“為AI技術(shù)發(fā)布會(huì)制作PPT,主題‘GLM-4.5開源革命’,包含架構(gòu)圖、性能對(duì)比表、應(yīng)用場(chǎng)景。”
第二個(gè)測(cè)試,我們選擇了比較常見的生成PPT,PPT生成雖然簡(jiǎn)單,但其中會(huì)涉及數(shù)據(jù)來源、數(shù)據(jù)準(zhǔn)確性、風(fēng)格美觀度等等要素。
GLM-4.5給出了滿意的交付,在整體風(fēng)格上采用了簡(jiǎn)約現(xiàn)代的風(fēng)格,紫色作為背景,藍(lán)色白色作為字體顏色,并且還搭配了半透明背景。在排版上,GLM-4.5并沒有在純文字的排版上“屎上雕花”,而是圖文并茂,將內(nèi)容進(jìn)行有結(jié)構(gòu)的排版。
比較令人驚喜的是,GLM-4.5的并不是簡(jiǎn)單的用關(guān)鍵詞生成圖片作為裝飾,而是實(shí)打?qū)嵣捎袃?nèi)容的圖片,如解釋什么是混合專家架構(gòu)用到了架構(gòu)圖。而且GLM-4.5還擅長(zhǎng)用“數(shù)據(jù)講故事”,在對(duì)mox進(jìn)行性能對(duì)比時(shí),GLM-4.5用了雷達(dá)圖、柱狀圖等,而不是單純的表格。
在功能性上,GLM-4.5支持用戶修改精準(zhǔn)文字,或者對(duì)整段文字用AI重寫,以及一鍵切換版本。
項(xiàng)目地址:https://chat.z.ai/s/ff4c6c14-539a-43f2-a55e-a2e3d0344680
測(cè)試3:用代碼做動(dòng)畫
prompts:“用代碼寫一個(gè)功能,小球碰到墻壁就會(huì)生成一個(gè)新的小球,新的小球采用新的顏色”
用代碼做動(dòng)畫考驗(yàn)GLM-4.5的邏輯能力,在編程時(shí)候很容易出現(xiàn)錯(cuò)誤。而GLM-4.5順利完成了球類互動(dòng)程序的開發(fā)。從“碰撞檢測(cè)”到“新球生成”再到“顏色切換”,每個(gè)核心邏輯都被精準(zhǔn)捕捉,代碼實(shí)現(xiàn)毫無偏差;交互細(xì)節(jié)更是處理得極為出色,新球生成的時(shí)機(jī)恰到好處,顏色差異等動(dòng)態(tài)效果流暢自然,遠(yuǎn)超基礎(chǔ)功能的實(shí)現(xiàn)水平。
而且在以往的測(cè)試中想要實(shí)現(xiàn)類似的效果,prompts要盡可能寫的全面,但GLM-4.5只需要根據(jù)簡(jiǎn)單的描述,就能推理出完整的代碼邏輯。
項(xiàng)目地址:https://chat.z.ai/s/080d15f3-cbdb-4406-916b-b16cb4548d3c
測(cè)試4:全棧開發(fā)制作GitHub倉(cāng)庫(kù)監(jiān)控智能體
prompts:“創(chuàng)建Agent:監(jiān)控GitHub倉(cāng)庫(kù)Star數(shù),每日9點(diǎn)郵件推送增長(zhǎng)趨勢(shì)?!?/p>
這個(gè)項(xiàng)目的難點(diǎn)在于將用戶的需求拆解用,如何調(diào)用工具,比如監(jiān)控GitHub需要API接口,發(fā)送郵件需要部署SMPT等協(xié)議。GLM-4.5可以自主完成需求拆解→邏輯設(shè)計(jì)→代碼生成→工具調(diào)用,全程絲滑流暢。
雖然在第一個(gè)版本中,項(xiàng)目一直無法添加指定的GitHub倉(cāng)庫(kù),用戶無需解釋處理bug的方式,只需描述現(xiàn)象GLM-4.5就能解決。
從代碼文件夾可以猜測(cè),這是一個(gè)基于Next.js構(gòu)建的全棧Web項(xiàng)目,采用TypeScript提供強(qiáng)類型支持以提升代碼質(zhì)量和可維護(hù)性,使用TailwindCSS實(shí)現(xiàn)高效的樣式開發(fā)。項(xiàng)目包含數(shù)據(jù)庫(kù)交互功能,還具備WebSocket相關(guān)的實(shí)時(shí)交互能力,適合開發(fā)需要?jiǎng)討B(tài)數(shù)據(jù)更新的場(chǎng)景。服務(wù)端邏輯可進(jìn)行自定義處理,包括接口管理和業(yè)務(wù)邏輯實(shí)現(xiàn)。
項(xiàng)目地址:https://chat.z.ai/s/6a643274-761e-4bb0-bc9c-403830aafcbb
測(cè)試5:雙人乒乓球游戲
prompts:“幫我生成一個(gè)雙人桌面乒乓球游戲”
游戲一直是被用來測(cè)試大模型能力的常見任務(wù),像貪吃蛇、打字游戲等,但上述游戲都是單人模式,我們來嘗試做一個(gè)可以雙人同時(shí)玩的“桌面乒乓球”。由于多了一個(gè)玩家,在交互邏輯和代碼邏輯上難度增加,但GLM-4.5也完成了復(fù)雜的邏輯和雙人操作規(guī)劃。
項(xiàng)目地址:https://chat.z.ai/s/efef0a71-0144-4a08-b4db-49cf9182b49c
1
“開源四杰”vs全球巨頭
我們將視線從具體的模型參數(shù)和評(píng)測(cè)榜單上移開,會(huì)發(fā)現(xiàn)這場(chǎng)競(jìng)賽的真正意義,已不再是技術(shù)本身的較量,而是各方在用行動(dòng)回答一個(gè)根本性問題:最頂尖的AI能力,究竟應(yīng)該作為少數(shù)公司的私有財(cái)產(chǎn)被守護(hù),還是作為一種數(shù)字時(shí)代的基礎(chǔ)設(shè)施被分享?中國(guó)的"開源四杰"用一場(chǎng)前所未有的開放行動(dòng),給出了他們的答案。他們不僅是在發(fā)布模型產(chǎn)品,也是在從根本上改變整個(gè)產(chǎn)業(yè)的成本結(jié)構(gòu),使競(jìng)爭(zhēng)的核心從“占有”技術(shù),轉(zhuǎn)向了如何運(yùn)用技術(shù)。
這一分歧直接改變了全球開發(fā)者和企業(yè)的處境。最直接的影響是,他們獲得了高性價(jià)比、可自主定制的替代方案,不必再被少數(shù)西方閉源巨頭鎖定。更深遠(yuǎn)地看,這也重塑了AI行業(yè)的商業(yè)邏輯。當(dāng)最強(qiáng)大的AI能力不再是昂貴的獨(dú)門秘籍,而是人人可用的“公開圖紙”時(shí),競(jìng)爭(zhēng)的重心便不可逆轉(zhuǎn)地從模型本身,轉(zhuǎn)向了應(yīng)用創(chuàng)新和生態(tài)系統(tǒng)的建設(shè)。最終的贏家尚難定論,但一個(gè)事實(shí)已經(jīng)很清晰,因?yàn)檫@四家公司的存在,全球AI技術(shù)的商業(yè)版圖和創(chuàng)新范式,都已被永久性地改寫。
點(diǎn)個(gè)愛心,再走吧
我花了八年時(shí)間 打開一扇又一扇門, 目睹一個(gè)又一個(gè)家中發(fā)生的故事 有人堅(jiān)信女兒患有多動(dòng)癥, 直到她真的患上多動(dòng)癥 有人偷偷希冀著, 父親向她走過來, 對(duì)她說一句, 好女兒, 你也辛苦了; 有人深藏秘密, 卻只能躲進(jìn)柜子里; 有人做了母親, 卻習(xí)慣在深夜躲進(jìn)廁所痛哭, 咬自己的手抑制哭聲; 有人在和母親第一百次的和解失敗時(shí), 她決定寬恕自己。 這九個(gè)故事 沒有一個(gè)是普羅大眾樂見的教育神話。 沒有一篇看了會(huì)感到喜悅。 沒有一篇看了心中不會(huì)亂糟糟的, 甚至覺得煩。 我想要你和我一起, 凝視那些臉, 凝視一個(gè)已經(jīng)被淡忘的初衷——把孩子帶到這世界上的初衷。 延伸閱讀:與 讓交通線路成風(fēng)景線 河南今年已打造180:4【公里旅、游】公路 的相關(guān)文章