桓靈韻
MiniMax、商湯科技、階躍星辰均發(fā)布了全新智能體(Agent)產品、復旦大學聯合多家科研機構研發(fā)發(fā)布倫理審查智能體“一鑒”、獨立分布式云計算服務商PPIO發(fā)布國內首個AgenticAI基礎設施服務平臺、連人工智能大會也有了智能體“Hi!WAIC”……今年世界人工智能大會上“首發(fā)”“首秀”能體令人眼花繚亂。AI大廠借助它完善自身產品矩陣,“新秀”企業(yè)則希望它在市場上搏出一番天地。
早在大語言模型橫空出世的2022年,專家就預測到AI領域的下一個爆點將是智能體,因為它是普通人接觸AI的“門戶”,一如互聯網時代的網頁、移動互聯網時代的App。三年過去,專家的預測成真了嗎?新品、大咖云集的世界人工智能大會,是觀察智能體演化的最佳平臺。
智能體迭代浪潮洶涌
從Agent、AIAgent到Agentic,在人們還沒有被科普這是個什么“新物種”時,智能體已經歷了多次迭代。據市場咨詢機構高德納預測,比智能體更智能的代理式人工智能(Agentic)在2025年十大戰(zhàn)略技術趨勢中位居首位,到2028年,將有15%的日常決策由代理式人工智能自主完成。
要理解智能體的演化之路,你只要想象電腦里原本住著一個能幫你干活的“小黃人”(Agent),隨著智能體的發(fā)展,“小黃人”越來越多,能干的活也越來越復雜。到了Agentic,只要人一聲令下,就能召集幾百乃至千上萬個“小黃人”一起干活。
Minimax智能體展區(qū)。沈湫莎攝
今年的MiniMax展臺設有Agent專區(qū),展示了他們最新發(fā)布的通用智能體產品——MiniMaxAgent。當用戶向它說出“請幫我設計一份盧浮宮導覽PPT”的需求時,不到一分鐘,排版靈活、視覺美觀的PPT就做好了。它看上去并非套用模板,而是獨具匠心。比如在介紹斷臂維納斯和蒙娜麗莎畫像時,Agent貼心地加上了講解語音。
“MiniMaxAgent具備三大核心能力,強大的編程能力、領先的多模態(tài)能力,以及開放的生態(tài),相當于人的大腦、感官和手腳,這些能力使它能夠像一個真正的人類團隊一樣,理解復雜需求,感知多維信息,并動手完成任務。”MiniMax研發(fā)工程師繆宇航說。
有人將智能體當虛擬員工,有人已將它玩出了“進階版”。其中的佼佼者當屬AI賦能內容創(chuàng)造公司特贊科技。今年4月,特贊發(fā)布首個商業(yè)研究多智能體atypica.AI,它可根據用戶的研究需求,從公開渠道自主瀏覽用戶內容來構建多個智能體,然后模擬不同智能體之間的互動來產出內容。也就是說,人們只需提出需求,稍待片刻后就能得到一份由“小黃人”幫你收集的基于真實社交信息的商業(yè)洞察、旅游設計和職業(yè)規(guī)劃。
比拼“腦眼耳嘴手”協同力
我們早就在和智能體打交道,比如2016年擊敗李世石的阿爾法狗。大模型出現后,智能體開始加速生長。2023年下半年發(fā)布的GPT-4V(有視覺功能的GPT-4)已經展露了AIAgent的雛形,去年底谷歌發(fā)布的Gemini(雙子座)2.0一口氣推出3款AIAgent,除了搜網頁、寫代碼等常規(guī)能力,它還可以在會話中保持長達10分鐘的記憶,并以人類正常語速與人對話。迭代速度甚至快過三個月升級一次的大模型。
為何智能體迭代如此之快?根本原因在于大模型。上海期智研究院學術帶頭人吳翼表示,在大模型爆發(fā)后,業(yè)內就預判了AIAgent將會爆發(fā),這也是國內外大廠集體押注智能體的原因。
PPIO智算營銷副總裁劉峰認為,今年對智能體商業(yè)化至關重要,經過數年大浪淘沙,智能體的架構已經趨向固定,即擁有計劃、行動、工具和記憶四個模塊。當架構穩(wěn)定后,技術路線也開始固定,誰能將模塊功能做得更好,誰將取得市場優(yōu)勢。這意味著未來智能體的迭代還會加速。
PPIO展區(qū)。受訪者供圖
未來智能體比拼什么?劉峰表示,主要是“腦-眼-耳-嘴-手”協同能力。智能體接到指令后需要自主拆解任務,這時就要考察其腦力,即解題思路;將指令分解成多個任務后,需要轉化成代碼執(zhí)行,這就考驗其動手能力;期間還要調用工具,或跟其他智能體“交流”,這就考驗其感官能力。
想要讓智能體更像人,還要具備長期記憶力。為了確保在長達數小時甚至數天的任務中不“失憶”,MiniMaxAgent擁有高達100萬的上下文窗口,并通過先進的Memory管理機制,靈活存取關鍵信息。更重要的是,它被賦予了“反思”的能力——在任務的每一個關鍵節(jié)點,它都會主動審視當前進展,發(fā)現潛在問題,并自主調整策略,確保最終交付的成果滿足甚至超越用戶預期。
安全問題值得重視
個人助手、心靈導師、知心閨蜜、虛擬分身……盡管智能體賽道熙熙攘攘,但相較于具身智能,對于智能體的投資有些不溫不火,除了AI大廠不斷拿出新品外,拿到真金白銀的企業(yè)并不多見,“爆款”也難覓蹤影。
安全是一個值得重視的問題。啟明創(chuàng)投主管合伙人周志峰打了個比方,如果兩家員工都在調用智能體做工作報告,一家公司的員工心血來潮問它,另一家公司的財報是多少,智能體能否守住秘密呢?
當下這個問題已經引起業(yè)內關注。一周前OpenAI發(fā)布了長篇警告,提示用戶使用AIAgent可能帶來的風險。例如,不法分子可能嘗試“誘騙”AI代理提供不該提供的私人信息,或采取不當行動。
PPIO在大會上發(fā)布看國內首款兼容E2B接口的“Agent沙箱”產品,它的最大賣點就是安全。沙箱就是專為Agent執(zhí)行任務設計的云端運行環(huán)境,可讓不同Agent沙箱的環(huán)境可實現完全隔離,當多個任務并發(fā)執(zhí)行時,每個任務都能在獨立環(huán)境中運行,從根源上避免數據泄漏和資源搶占沖突。同時,PPIOAgent沙箱還支持同時快速啟動數千個沙箱實例的高并發(fā)創(chuàng)建能力,可充分滿足業(yè)務場景中的高并發(fā)需求,加快結果交付速度,保障用戶體驗。
初創(chuàng)團隊想要靠智能體一夜暴富,恐怕有點難。周志峰說:“每個人都知道智能體是AI時代的交互入口,也就是說現在所有互聯網產品形態(tài)未來都可能以智能體形態(tài)展現,那么智能體+的后綴才是投資人關注的重點。”
可以確定的是,智能體將改變人們的工作形態(tài),這一天很快將會到來。未來人們如何開展工作?第一步,確定任務目標;第二步,將任務交給不同的智能體完成;第三步,驗收項目。在這個系統(tǒng)中,毫無疑問,提出想法才是最重要的。
來源:紅網
作者:楊大雪
編輯:樹佳晨
本文為紅辣椒評論 原創(chuàng)文章,僅系作者個人觀點,不代表紅網立場。轉載請附原文出處鏈接和本聲明。