張睿群
MiniMax、商湯科技、階躍星辰均發(fā)布了全新智能體(Agent)產(chǎn)品、復(fù)旦大學(xué)聯(lián)合多家科研機(jī)構(gòu)研發(fā)發(fā)布倫理審查智能體“一鑒”、獨(dú)立分布式云計(jì)算服務(wù)商PPIO發(fā)布國內(nèi)首個AgenticAI基礎(chǔ)設(shè)施服務(wù)平臺、連人工智能大會也有了智能體“Hi!WAIC”……今年世界人工智能大會上“首發(fā)”“首秀”能體令人眼花繚亂。AI大廠借助它完善自身產(chǎn)品矩陣,“新秀”企業(yè)則希望它在市場上搏出一番天地。
早在大語言模型橫空出世的2022年,專家就預(yù)測到AI領(lǐng)域的下一個爆點(diǎn)將是智能體,因?yàn)樗瞧胀ㄈ私佑|AI的“門戶”,一如互聯(lián)網(wǎng)時(shí)代的網(wǎng)頁、移動互聯(lián)網(wǎng)時(shí)代的App。三年過去,專家的預(yù)測成真了嗎?新品、大咖云集的世界人工智能大會,是觀察智能體演化的最佳平臺。
智能體迭代浪潮洶涌
從Agent、AIAgent到Agentic,在人們還沒有被科普這是個什么“新物種”時(shí),智能體已經(jīng)歷了多次迭代。據(jù)市場咨詢機(jī)構(gòu)高德納預(yù)測,比智能體更智能的代理式人工智能(Agentic)在2025年十大戰(zhàn)略技術(shù)趨勢中位居首位,到2028年,將有15%的日常決策由代理式人工智能自主完成。
要理解智能體的演化之路,你只要想象電腦里原本住著一個能幫你干活的“小黃人”(Agent),隨著智能體的發(fā)展,“小黃人”越來越多,能干的活也越來越復(fù)雜。到了Agentic,只要人一聲令下,就能召集幾百乃至千上萬個“小黃人”一起干活。
Minimax智能體展區(qū)。沈湫莎攝
今年的MiniMax展臺設(shè)有Agent專區(qū),展示了他們最新發(fā)布的通用智能體產(chǎn)品——MiniMaxAgent。當(dāng)用戶向它說出“請幫我設(shè)計(jì)一份盧浮宮導(dǎo)覽PPT”的需求時(shí),不到一分鐘,排版靈活、視覺美觀的PPT就做好了。它看上去并非套用模板,而是獨(dú)具匠心。比如在介紹斷臂維納斯和蒙娜麗莎畫像時(shí),Agent貼心地加上了講解語音。
“MiniMaxAgent具備三大核心能力,強(qiáng)大的編程能力、領(lǐng)先的多模態(tài)能力,以及開放的生態(tài),相當(dāng)于人的大腦、感官和手腳,這些能力使它能夠像一個真正的人類團(tuán)隊(duì)一樣,理解復(fù)雜需求,感知多維信息,并動手完成任務(wù)?!盡iniMax研發(fā)工程師繆宇航說。
有人將智能體當(dāng)虛擬員工,有人已將它玩出了“進(jìn)階版”。其中的佼佼者當(dāng)屬AI賦能內(nèi)容創(chuàng)造公司特贊科技。今年4月,特贊發(fā)布首個商業(yè)研究多智能體atypica.AI,它可根據(jù)用戶的研究需求,從公開渠道自主瀏覽用戶內(nèi)容來構(gòu)建多個智能體,然后模擬不同智能體之間的互動來產(chǎn)出內(nèi)容。也就是說,人們只需提出需求,稍待片刻后就能得到一份由“小黃人”幫你收集的基于真實(shí)社交信息的商業(yè)洞察、旅游設(shè)計(jì)和職業(yè)規(guī)劃。
比拼“腦眼耳嘴手”協(xié)同力
我們早就在和智能體打交道,比如2016年擊敗李世石的阿爾法狗。大模型出現(xiàn)后,智能體開始加速生長。2023年下半年發(fā)布的GPT-4V(有視覺功能的GPT-4)已經(jīng)展露了AIAgent的雛形,去年底谷歌發(fā)布的Gemini(雙子座)2.0一口氣推出3款A(yù)IAgent,除了搜網(wǎng)頁、寫代碼等常規(guī)能力,它還可以在會話中保持長達(dá)10分鐘的記憶,并以人類正常語速與人對話。迭代速度甚至快過三個月升級一次的大模型。
為何智能體迭代如此之快?根本原因在于大模型。上海期智研究院學(xué)術(shù)帶頭人吳翼表示,在大模型爆發(fā)后,業(yè)內(nèi)就預(yù)判了AIAgent將會爆發(fā),這也是國內(nèi)外大廠集體押注智能體的原因。
PPIO智算營銷副總裁劉峰認(rèn)為,今年對智能體商業(yè)化至關(guān)重要,經(jīng)過數(shù)年大浪淘沙,智能體的架構(gòu)已經(jīng)趨向固定,即擁有計(jì)劃、行動、工具和記憶四個模塊。當(dāng)架構(gòu)穩(wěn)定后,技術(shù)路線也開始固定,誰能將模塊功能做得更好,誰將取得市場優(yōu)勢。這意味著未來智能體的迭代還會加速。
PPIO展區(qū)。受訪者供圖
未來智能體比拼什么?劉峰表示,主要是“腦-眼-耳-嘴-手”協(xié)同能力。智能體接到指令后需要自主拆解任務(wù),這時(shí)就要考察其腦力,即解題思路;將指令分解成多個任務(wù)后,需要轉(zhuǎn)化成代碼執(zhí)行,這就考驗(yàn)其動手能力;期間還要調(diào)用工具,或跟其他智能體“交流”,這就考驗(yàn)其感官能力。
想要讓智能體更像人,還要具備長期記憶力。為了確保在長達(dá)數(shù)小時(shí)甚至數(shù)天的任務(wù)中不“失憶”,MiniMaxAgent擁有高達(dá)100萬的上下文窗口,并通過先進(jìn)的Memory管理機(jī)制,靈活存取關(guān)鍵信息。更重要的是,它被賦予了“反思”的能力——在任務(wù)的每一個關(guān)鍵節(jié)點(diǎn),它都會主動審視當(dāng)前進(jìn)展,發(fā)現(xiàn)潛在問題,并自主調(diào)整策略,確保最終交付的成果滿足甚至超越用戶預(yù)期。
安全問題值得重視
個人助手、心靈導(dǎo)師、知心閨蜜、虛擬分身……盡管智能體賽道熙熙攘攘,但相較于具身智能,對于智能體的投資有些不溫不火,除了AI大廠不斷拿出新品外,拿到真金白銀的企業(yè)并不多見,“爆款”也難覓蹤影。
安全是一個值得重視的問題。啟明創(chuàng)投主管合伙人周志峰打了個比方,如果兩家員工都在調(diào)用智能體做工作報(bào)告,一家公司的員工心血來潮問它,另一家公司的財(cái)報(bào)是多少,智能體能否守住秘密呢?
當(dāng)下這個問題已經(jīng)引起業(yè)內(nèi)關(guān)注。一周前OpenAI發(fā)布了長篇警告,提示用戶使用AIAgent可能帶來的風(fēng)險(xiǎn)。例如,不法分子可能嘗試“誘騙”AI代理提供不該提供的私人信息,或采取不當(dāng)行動。
PPIO在大會上發(fā)布看國內(nèi)首款兼容E2B接口的“Agent沙箱”產(chǎn)品,它的最大賣點(diǎn)就是安全。沙箱就是專為Agent執(zhí)行任務(wù)設(shè)計(jì)的云端運(yùn)行環(huán)境,可讓不同Agent沙箱的環(huán)境可實(shí)現(xiàn)完全隔離,當(dāng)多個任務(wù)并發(fā)執(zhí)行時(shí),每個任務(wù)都能在獨(dú)立環(huán)境中運(yùn)行,從根源上避免數(shù)據(jù)泄漏和資源搶占沖突。同時(shí),PPIOAgent沙箱還支持同時(shí)快速啟動數(shù)千個沙箱實(shí)例的高并發(fā)創(chuàng)建能力,可充分滿足業(yè)務(wù)場景中的高并發(fā)需求,加快結(jié)果交付速度,保障用戶體驗(yàn)。
初創(chuàng)團(tuán)隊(duì)想要靠智能體一夜暴富,恐怕有點(diǎn)難。周志峰說:“每個人都知道智能體是AI時(shí)代的交互入口,也就是說現(xiàn)在所有互聯(lián)網(wǎng)產(chǎn)品形態(tài)未來都可能以智能體形態(tài)展現(xiàn),那么智能體+的后綴才是投資人關(guān)注的重點(diǎn)?!?/p>
可以確定的是,智能體將改變?nèi)藗兊墓ぷ餍螒B(tài),這一天很快將會到來。未來人們?nèi)绾伍_展工作?第一步,確定任務(wù)目標(biāo);第二步,將任務(wù)交給不同的智能體完成;第三步,驗(yàn)收項(xiàng)目。在這個系統(tǒng)中,毫無疑問,提出想法才是最重要的。
來源:紅網(wǎng)
作者:謝嘉法
編輯:疏君昊
本文為紅辣椒評論 原創(chuàng)文章,僅系作者個人觀點(diǎn),不代表紅網(wǎng)立場。轉(zhuǎn)載請附原文出處鏈接和本聲明。