8月1日凌晨,Manus首席科學(xué)家Peak季逸超公開表示,Manus發(fā)布新功能WideResearch,該功能目前僅對Pro用戶開放,未來會(huì)陸續(xù)向Basic和Plus用戶開放。Peak上次為產(chǎn)品錄制視頻還是今年3月Manus引發(fā)關(guān)注、引起Agent熱潮時(shí)。隨后的一段時(shí)間內(nèi),Manus經(jīng)歷了裁員風(fēng)波、與阿里在中國的合作擱置等事件。
在Manus傳來最新消息的同時(shí),國內(nèi)的Agent(智能體)廠商也探索出了一套新的玩法。今年的世界人工智能大會(huì)(WAIC)上,階躍星辰、月之暗面、MinMax、智譜這四家“AI大模型小虎”齊聚現(xiàn)場,都講出了新的故事。
大模型降溫?Agent登場
根據(jù)官方數(shù)據(jù),今年WAIC吸引了800余家企業(yè)特別是國內(nèi)數(shù)十家AI龍頭鏈主企業(yè)參展,共有40余款大模型集中亮相。根據(jù)公開報(bào)道,2024年WAIC的大模型數(shù)量有近百款。與參展模型數(shù)量相對應(yīng)的是核心廠商的減少——今年WAIC“AI大模型六小虎”中的百川智能與零一萬物都缺席了。
仍在參展的“小虎”找到了新范式——Agent。
階躍星辰在WAIC正式開始前發(fā)布了其新一代基礎(chǔ)大模型Step3。在展位前,階躍聯(lián)合吉利推出的AI智能座艙吉利銀河M9讓現(xiàn)場想體驗(yàn)的觀眾排起了長龍。據(jù)現(xiàn)場工作人員介紹,搭載了階躍星辰多模態(tài)大模型的AI智能座艙在行業(yè)內(nèi)首次實(shí)現(xiàn)了端到端語音大模型的量產(chǎn)上車。南都N視頻記者還了解到,目前在手機(jī)方面階躍星辰已覆蓋國內(nèi)超過一半頭部國產(chǎn)手機(jī)廠商,深度合作打造手機(jī)Agent體驗(yàn)。
月之暗面的今年的展臺(tái)則頗為簡樸。不過就在WAIC前兩周,月之暗面正式發(fā)布并開源了萬億參數(shù)的KimiK2大模型,同樣強(qiáng)調(diào)模型的據(jù)通用Agent任務(wù)能力。
智譜在WAIC最后一日(7月29日)發(fā)布了新模型GLM-4.5和GLM-4.5-Air,介紹性能時(shí)表示,在涵蓋智能體(3項(xiàng))、推理(7項(xiàng))和編程(2項(xiàng))的12個(gè)基準(zhǔn)測試上,將GLM-4.5與來自O(shè)penAI、Anthropic、GoogleDeepMind、xAI、阿里巴巴、月之暗面和深度求索的各種模型進(jìn)行了比較,測評結(jié)果顯示智譜模型能力目前在國內(nèi)排名第一。
更早前的6月,另一家大模型小虎Minimax開啟了連續(xù)5天的新品發(fā)布,其中重點(diǎn)發(fā)布了目前行業(yè)最高難度運(yùn)動(dòng)場景的新視頻生成模型Hailuo02和MiniMaxAgent、視頻Agent等產(chǎn)品。
“為什么2023年大家不怎么談Agent,到了2025年才說是Agent元年?今年大模型能力已經(jīng)到這個(gè)水平了,它能支撐真正的Agent?!鄙虦萍悸?lián)合創(chuàng)始人、執(zhí)行董事、首席科學(xué)家林達(dá)華在WAIC上提到,Agent是大模型能力落地真實(shí)世界的重要技術(shù)載體,依賴非常強(qiáng)的推理、反思、規(guī)劃、決策能力,這些能力都依托于大模型來產(chǎn)生。
Agent從通用走向垂類場景
自今年3月Manus刮起Agent大風(fēng)后,多個(gè)Agent隨之出現(xiàn),讓用戶等待許久、花費(fèi)了諸多算力,但跑出來的成品根本不能用。當(dāng)AI故事從大模型轉(zhuǎn)向Agent,除了拋概念、追風(fēng)口,大家更關(guān)注的是能不能創(chuàng)造價(jià)值。
“Agent最后要走通的,一是需要基礎(chǔ)模型有比較強(qiáng)的制定跟隨、意圖反思、編程、推理等能力;二是一定要圍繞打穿場景去迭代,否則這個(gè)Agent的價(jià)值是不落地的。對于真實(shí)的場景來說,最重要的是Agent的成功率。最怕的就是它半天給你做了一大堆的事,最后不能解決你的問題、你還得重做一遍?!绷诌_(dá)華提到,盡管目前通用Agent產(chǎn)品在刷測評榜單時(shí)看上去分?jǐn)?shù)都很高,但商湯內(nèi)部在用這些產(chǎn)品時(shí)會(huì)看到它們并不落地。
打造場景化、垂類Agent產(chǎn)品,正在成為一大行業(yè)趨勢。
7月27日,在WAIC上,騰訊集中展示了12個(gè)垂直智能體(Agent)應(yīng)用,覆蓋企業(yè)服務(wù)、生活服務(wù)與辦公效率三大核心場景。以共富AI智能體為案例,騰訊SSV為村共富鄉(xiāng)村負(fù)責(zé)人陳晶晶現(xiàn)場介紹,當(dāng)下廣闊鄉(xiāng)村恰恰急缺專業(yè)的經(jīng)營性人才,導(dǎo)致大量的優(yōu)質(zhì)“土特產(chǎn)”和農(nóng)文旅產(chǎn)品難以高效銜接市場,共富AI智能體首版產(chǎn)品主要針對微信生態(tài)的“土特產(chǎn)”小店與農(nóng)文旅營銷兩大核心場景,通過一次流程即可生成“土特產(chǎn)”電商素材和農(nóng)文旅營銷全案內(nèi)容。
金山辦公則在最新推出的WPSAI3.0版本——WPS靈犀中搭載了Agent能力,專攻打工人的辦公場景。南都記者在現(xiàn)場看到,在實(shí)機(jī)演示中,AIPPT將一篇演講稿潤色、在規(guī)定時(shí)間內(nèi)分成了適配講解速度的頁數(shù),還能實(shí)現(xiàn)挑選模板后一鍵生成,文字格式做到整齊、自主排版,可達(dá)到交付的效果。
參觀者在WAIC展覽現(xiàn)場體驗(yàn)使用WPSAI辦公操作系統(tǒng)。
“通用智能體非常強(qiáng)大,但企業(yè)不可能將數(shù)據(jù)傳送到云端數(shù)據(jù)庫,私有化部署很重要,在與客戶對接的過程中,我們發(fā)現(xiàn)用戶的需求都極其個(gè)性化,目前我們采取的模式是端到端的項(xiàng)目制交付的方式。”極光集團(tuán)副總裁殷浩向南都N視頻記者介紹,極光旗下GPTBots.ai在本次WAIC面向企業(yè)端上新全新Multi-Agent平臺(tái),該平臺(tái)內(nèi)置多種開箱即用的AIAgent,提供涵蓋開發(fā)、產(chǎn)品、測試、算法、數(shù)據(jù)、營銷等多個(gè)領(lǐng)域的AIAgent角色,已布局了售前咨詢、售后客服、數(shù)據(jù)分析和撰寫專業(yè)報(bào)告等場景,目前90%以上的業(yè)務(wù)都布局在海外。
談及Agent在C端和B端的商業(yè)化情況,殷浩認(rèn)為C端未必一定走不通?!拔覀儧]有做C端產(chǎn)品,并不是認(rèn)為C端走不通。當(dāng)B端用戶需求共性足夠多時(shí),也許可以將這些共性提煉成一個(gè)C端的產(chǎn)品。我們做海外市場是需要和各國進(jìn)行交流,在交流過程中會(huì)發(fā)現(xiàn)翻譯就是Agent的一個(gè)很好的場景,目前我們還在驗(yàn)證這個(gè)產(chǎn)品的過程中。C端并不一定就不能盈利,考驗(yàn)的是極致的產(chǎn)品能力”。
作為專注金融服務(wù)領(lǐng)域的自研大語言模型,“恒紀(jì)元”由恒生活數(shù)科技術(shù)團(tuán)隊(duì)于2023年11月7日重磅發(fā)布。在本屆展會(huì)上,依托“恒紀(jì)元”打造的六大智能應(yīng)用矩陣也悉數(shù)登場:“智能對話機(jī)器人”、“智能文本機(jī)器人”、“AI資產(chǎn)分析師”、“AI資產(chǎn)管理系統(tǒng)”、“AI法律服務(wù)平臺(tái)”以及“恒紀(jì)元AI智能體開發(fā)工廠”。據(jù)悉這些應(yīng)用以場景化落地為核心,通過算法迭代與行業(yè)知識(shí)深度融合,加速推動(dòng)金融服務(wù)模式轉(zhuǎn)型升級。
采寫:南都N視頻記者林文琪