足夠優(yōu)秀的專屬infra,是Agent應(yīng)用生態(tài)持續(xù)繁榮的基石。
作者|白石
編輯|鄭玄
Agent正在成為AI應(yīng)用的主流產(chǎn)品形式。作為2025年最受矚目的技術(shù)之一,全球AIAgent市場(chǎng)規(guī)模已突破50億美元,年增長(zhǎng)率高達(dá)40%。相關(guān)數(shù)據(jù)統(tǒng)計(jì),過去3個(gè)月涌現(xiàn)的Agent產(chǎn)品,超過了去年全年的總和,2025年可以稱為Agent元年。
繼OpenAI在2月發(fā)布Agent應(yīng)用DeepResearch引爆全球后,3月發(fā)布的manus又為這股Agent熱潮添上了一把火,當(dāng)時(shí)它不但邀請(qǐng)碼一碼難求,之后更獲得Benchmark領(lǐng)投的7500萬(wàn)美元的新融資。除了manus,海外的垂直領(lǐng)域Agent公司也頻頻涌現(xiàn)高估值公司,例如編碼Agent公司Cognition估值即將突破100億美元,人力資源Agent公司Mercor也達(dá)到了20億美元估值。
在觀察到Agent的崛起以后,紅杉資本認(rèn)為,AI下一階段的主角是Agent。福布斯在評(píng)選AI50榜單時(shí)也總結(jié)到:AIAgent將全面超越聊天類AI應(yīng)用。
福布斯的理由是,聊天類應(yīng)用主要用于回答問題或根據(jù)指令生成內(nèi)容;而Agent的自動(dòng)化程度更高,可以完成完整的工作流程,直接交付高質(zhì)量結(jié)果。這使得AI不再只是「助手」,而升級(jí)成「執(zhí)行者」。
每一次軟件應(yīng)用范式的改變,都會(huì)推動(dòng)基礎(chǔ)設(shè)施(infra)的進(jìn)化,而基礎(chǔ)設(shè)施的改變,也會(huì)讓應(yīng)用的體驗(yàn)得以提升。
傳統(tǒng)的本地部署基礎(chǔ)設(shè)施,其高成本,低彈性的缺點(diǎn),促進(jìn)了云計(jì)算的誕生和成熟,而隨著云計(jì)算基礎(chǔ)設(shè)施越變?cè)胶?,就催生了萬(wàn)億美元規(guī)模的SaaS軟件行業(yè),其領(lǐng)頭羊SalesForce的市值,目前約為2570億美元。云計(jì)算作為基礎(chǔ)設(shè)施,也為淘寶天貓、抖音、YouTube等用戶超億級(jí)別的互聯(lián)網(wǎng)應(yīng)用打好了地基,讓它們能發(fā)展壯大。
在Agent應(yīng)用開始爆發(fā)的同時(shí),與Agent使用的相關(guān)隱憂也在顯現(xiàn)。例如終端性能限制,AI工具鏈配置麻煩,安全問題,長(zhǎng)期記憶問題等,若有一個(gè)Agent專屬的基礎(chǔ)設(shè)施產(chǎn)品出現(xiàn),解決Agent使用面臨的一系列問題,將進(jìn)一步加速Agent的普及。
7月28日,上海世界人工智能大會(huì)WAIC上,阿里云正式推出了首款專為AIAgent打造的"超級(jí)大腦"——無(wú)影AgentBay。它能突破本地部署的算力限制,提供專屬Agent運(yùn)行的沙箱環(huán)境,并為Agent配齊了Browser、CodeSpace、ComputerUse、MobileUse、Memory等AI工具,還具備視覺理解、自然語(yǔ)言控制、任務(wù)解析等多項(xiàng)AI技能,僅需三行代碼即可接入,做到"拎包入住",讓AI開發(fā)者們徹底告別繁瑣的安裝和配置。
01
本地算力限制,安全性差,
Agent的使用面臨5大痛點(diǎn)
利用AI的能力將工作流程自動(dòng)化,這類產(chǎn)品早已有之。在生成式AI出現(xiàn)之前,就有RPA類產(chǎn)品大行其道。但限于當(dāng)時(shí)的AI能力還較弱,RPA只能將簡(jiǎn)單的單一工作流程自動(dòng)化,不具備真正的智能,不能解決復(fù)合化的復(fù)雜問題。
直到生成式AI出現(xiàn),各種真正具備的智能的Agent應(yīng)用出現(xiàn),人們才從AI自動(dòng)化中獲得了很好的效率提升。
Agent本質(zhì)是一個(gè)能調(diào)用各種工具的AI。例如manus,它用提示詞控制AI模型,并編排了一個(gè)精巧的工作流(workflow),讓AI模型使用各種不同的工具,然后完成一個(gè)復(fù)雜的任務(wù)。
但是,無(wú)論是以DeepResearch為代表的研究類Agent應(yīng)用,還是manus這樣的通用Agent應(yīng)用,都是通過網(wǎng)頁(yè)或App的形式對(duì)終端的用戶提供。
這種提供方式,并不適合專業(yè)的AI開發(fā)者,AI創(chuàng)業(yè)者和企業(yè)用戶。因?yàn)樗麄兊男枨笫亲孉gent使用專有的數(shù)據(jù),無(wú)縫地嵌入到業(yè)務(wù)中,為業(yè)務(wù)持續(xù)提供價(jià)值。
商業(yè)化使用Agent,首先遇到的就是終端性能,但當(dāng)一個(gè)功能強(qiáng)大的Agent在用戶本地的終端運(yùn)行時(shí),會(huì)遇到各種各樣的問題。
首當(dāng)其沖的是AI推理的算力限制。如前文所述,Agent本質(zhì)是一個(gè)能調(diào)用各種工具的AI,它由一個(gè)能力強(qiáng)大的AI模型及一堆供它調(diào)用的工具鏈組成。運(yùn)行能力強(qiáng)大的AI模型,通常需要AI專用的算力,由GPU或AI專用芯片提供,幾乎沒有消費(fèi)級(jí)的PC或手機(jī)能部署高精度的大模型本體。因此,目前大量的Agent公司都采用了云端算力的方式,將模型的訓(xùn)練和推理都放在云端完成。
其次是執(zhí)行任務(wù)的算力。Agent任務(wù)具有高并發(fā)、高算力需求的特點(diǎn),企業(yè)在本地部署了Agent后,當(dāng)Agent支持的業(yè)務(wù)量開始快速增長(zhǎng)時(shí),馬上就需要更多算力,本地部署的速度跟不上;反過來,當(dāng)這個(gè)業(yè)務(wù)閑置時(shí),又沒有那么多算力需求,會(huì)對(duì)企業(yè)造成巨大資源浪費(fèi)。
根據(jù)阿里云無(wú)影事業(yè)部總裁張獻(xiàn)濤博士的觀察:manus在初期是用本地服務(wù)器的虛擬機(jī)去做任務(wù),這也導(dǎo)致它在用戶大量涌入的時(shí)候,出現(xiàn)了性能不足、服務(wù)不穩(wěn)定的情況,一定程度上影響了初期口碑。如果Mauns的誕生晚三個(gè)月,這個(gè)問題很容易就能解決了。
其次是AI工具配置麻煩。Agent本質(zhì)是一個(gè)能調(diào)用各種工具的AI,若不能調(diào)用工具,Agent就很難具備解決復(fù)雜問題的能力。
例如,要搭建一個(gè)銷售類Agent,它需要調(diào)用CRM獲取客戶信息,調(diào)用內(nèi)部的知識(shí)庫(kù)以備自動(dòng)向客戶介紹產(chǎn)品,還需要調(diào)用各種通訊工具以便直接觸及到客戶。
國(guó)內(nèi)各地已經(jīng)有不少的「智算中心」,可以初步緩解算力限制問題,但是這些「智算中心」卻只提供算力,不提供搭建Agent需要的各種工具鏈。
企業(yè)要定制與業(yè)務(wù)緊密耦合的Agent,就需要自己搭建工具鏈。這是一個(gè)很復(fù)雜的工程,一方面需要很高的開發(fā)成本,另一方面,在Agent正式部署前,需要不短的開發(fā)時(shí)間,這反而會(huì)延緩企業(yè)的業(yè)務(wù)發(fā)展速度。
當(dāng)解決了算力限制和AI工具配置的問題后,專業(yè)AI開發(fā)者和企業(yè)用戶馬上會(huì)遇到第三個(gè)問題:權(quán)限沖突。
開發(fā)和部署Agent的目的,是將其嵌入到自己的業(yè)務(wù)中。而這個(gè)過程,除了要調(diào)用各種各樣的工具以外,還需要與業(yè)務(wù)中的各類軟件緊密配合。
以前文提到的銷售類Agent為例,當(dāng)它調(diào)用CRM,內(nèi)部知識(shí)庫(kù)和對(duì)外通訊工具時(shí),不僅會(huì)占用本地計(jì)算資源,更麻煩的是,它會(huì)搶占人類員工的訪問和操作權(quán)限。當(dāng)Agent不是與人類協(xié)同,而是互相內(nèi)耗時(shí),反而可能拉低整個(gè)團(tuán)隊(duì)的整體工作效率。
對(duì)于企業(yè)用戶,還有一個(gè)大問題,就是安全性差。企業(yè)使用Agent,本身的目的就是要增強(qiáng)自己的業(yè)務(wù),或者提高員工的效率,這勢(shì)必需要使用公司的內(nèi)部數(shù)據(jù)。但是Agent任務(wù)執(zhí)行是一個(gè)黑盒子,執(zhí)行過程對(duì)于用戶來說是不透明的,有可能對(duì)本地電腦文件系統(tǒng)進(jìn)行修改、刪減等操作,輕則留下垃圾文件造成系統(tǒng)臃腫,重則造成文件丟失或數(shù)據(jù)泄露。
更進(jìn)一步,其實(shí)Agent在調(diào)用工具時(shí),本身就會(huì)有安全隱患。據(jù)統(tǒng)計(jì),超過43%的MCP(ModelContextProtocol,調(diào)用AI工具的協(xié)議)服務(wù)節(jié)點(diǎn)存在未經(jīng)驗(yàn)證的Shell調(diào)用路徑,超過83%的部署存在MCP配置漏洞;88%的AI組件部署根本沒啟用任何形式的防護(hù)機(jī)制。
還是回到那個(gè)銷售類Agent,它是需要直接與外部客戶溝通和接觸的,若它的安全性無(wú)法保證,那么對(duì)于企業(yè)的業(yè)務(wù)和信譽(yù)都是重大打擊。
事實(shí)上,當(dāng)未來Agent的使用越來越普及,安全和信任的重要性,在AI時(shí)代比在互聯(lián)網(wǎng)時(shí)代更加重要。
當(dāng)真正把本地部署Agent用起來后,企業(yè)還會(huì)面臨一個(gè)問題,就是Agent缺乏長(zhǎng)期記憶。當(dāng)缺乏語(yǔ)義記憶和場(chǎng)景記憶,Agent只能完成一次性的任務(wù),這會(huì)嚴(yán)重影響Agent在企業(yè)業(yè)務(wù)中的使用范圍。
當(dāng)企業(yè)用戶將Agent用到業(yè)務(wù)中時(shí),如果能為Agent賦予長(zhǎng)期記憶,那么Agent除了能夠完成多次任務(wù),企業(yè)還可以根據(jù)這些記憶迭代Agent,讓它對(duì)業(yè)務(wù)或用戶的理解越來越深,在特定任務(wù)上的能力越來越強(qiáng)。
正如張獻(xiàn)濤博士所說,如果只是完成一個(gè)簡(jiǎn)單的任務(wù),可能不需要長(zhǎng)期記憶。但是如果把Agent定位成一個(gè)數(shù)字分身,或者數(shù)字員工,記憶能力,尤其是長(zhǎng)期記憶能力是必須要具備的。
02
Agent專用infra:
讓Agent安全、快速、低成本的部署,
為Agent提供集成AI工具鏈的沙箱環(huán)境
阿里云已在AI領(lǐng)域有豐富布局,涵蓋了模型,工具,開發(fā)者社區(qū),當(dāng)然也有自己的Agent;例如他們開源了自主搜索AI智能體項(xiàng)目WebAgent,用于提升AI在多步驟信息搜索領(lǐng)域的性能。
作為在AI領(lǐng)域布局最完整的廠商,再結(jié)合阿里云多年在云計(jì)算領(lǐng)域的積累,他們推出了Agentinfra類產(chǎn)品AgentBay。它扎根客戶的需求,解決了Agent使用中的各類痛點(diǎn)。
對(duì)于最緊要的算力限制痛點(diǎn),AgentBay提供了來自云端的高彈性和高并發(fā)算力,它的高并發(fā)能力能夠達(dá)到百萬(wàn)級(jí)別,滿足爆款A(yù)I應(yīng)用高增長(zhǎng)的算力需求,釋放本地算力限制。
而且它僅需三行代碼即可接入,做到"拎包入住",讓AI開發(fā)者們徹底告別繁瑣的安裝和配置。
對(duì)于AI工具配置麻煩和本地部署權(quán)限沖突這兩個(gè)問題,AgentBay可在云端一鍵生成專屬Agent運(yùn)行的沙箱環(huán)境,保證Agent執(zhí)行對(duì)本地環(huán)境的零侵入,也就不存在占用本地計(jì)算資源,搶占人類員工的訪問和操作權(quán)限這些麻煩事。
而且,這些沙箱環(huán)境集成了Browser、CodeSpace、ComputerUse、MobileUse、Memory等AI工具,能夠執(zhí)行代碼運(yùn)行、網(wǎng)頁(yè)瀏覽、數(shù)據(jù)分析、程序開發(fā)、表格制作等基礎(chǔ)任務(wù),還具備視覺理解、自然語(yǔ)言控制、任務(wù)解析等多項(xiàng)AI技能。
例如Browser這個(gè)工具,可以將云端瀏覽器自動(dòng)化,支持網(wǎng)頁(yè)爬取、自動(dòng)化測(cè)試、流程處理,幫助AIAgent獲得了獲取外部信息的能力。
CodeSpace則是一個(gè)更關(guān)鍵的工具,它提供代碼運(yùn)行環(huán)境,支持多語(yǔ)言解釋器和開發(fā)工具鏈。有了CodeSpace,Agent可以自己寫代碼,按需生成自己在特定任務(wù)中需要的工具,然后再去調(diào)用,這樣的話,理論上它能夠完成任何企業(yè)需要的任務(wù)。
針對(duì)AI安全性差的問題,阿里云此前就發(fā)布了AI云盾(CloudShieldforAI)系列產(chǎn)品,提供模型應(yīng)用端到端的安全解決方案?,F(xiàn)在它將這些能力升級(jí)并集成到了AgentBay中。
AgentBay能夠?yàn)锳gent應(yīng)用提供多重安全防護(hù),包括:環(huán)境隔離,網(wǎng)絡(luò)隔離、文件系統(tǒng)隔離、資源限制、全量審計(jì)。它符合企業(yè)級(jí)安全標(biāo)準(zhǔn),支持SOC2/HIPAA合規(guī),能讓中小企業(yè)以低成本獲得軍工級(jí)安全能力。
對(duì)于企業(yè)級(jí)用戶在搭建跨多個(gè)部門和平臺(tái),完成復(fù)雜任務(wù)的Agent時(shí),AgentBay提供了Context持久化云工作區(qū)。
Context持久化云工作區(qū),既解決了Agent沒有長(zhǎng)期記憶的問題,又能支持不同部門的協(xié)作。
具體來說,它有自研的跨平臺(tái)數(shù)據(jù)漫游系統(tǒng),實(shí)現(xiàn)用戶數(shù)據(jù)、狀態(tài)甚至內(nèi)存級(jí)別的持久化。
此外,它支持會(huì)話間狀態(tài)保持,可動(dòng)態(tài)掛載給不同環(huán)境,支持按需加載和實(shí)時(shí)切換。
對(duì)于不同部門的協(xié)作,它支持免密登錄、歷史文件編輯、專屬知識(shí)等高階能力。
在Context持久化云工作區(qū)的支持下,企業(yè)用戶不但能夠讓Agent擁有長(zhǎng)期記憶,不斷迭代Agent的能力,還能搭建跨部門的,可解決復(fù)雜問題的Agent,并支持不同部門的協(xié)作,共同使用和優(yōu)化這個(gè)Agent。
在解決了Agent使用的5大痛點(diǎn)之后,AgentBay還為企業(yè)用戶提供了一些更周到并且影響深遠(yuǎn)的功能和服務(wù)。
例如,它同時(shí)兼容不同的操作系統(tǒng)平臺(tái),包括Windows、Linux和Android。
對(duì)于Windows,它提供云端Windows桌面環(huán)境,支持Windows應(yīng)用程序自動(dòng)化;對(duì)于Linux,它提供云端Linux系統(tǒng)環(huán)境,支持命令行和系統(tǒng)工具;對(duì)于Android,它有云端安卓環(huán)境,支持移動(dòng)應(yīng)用測(cè)試和流程自動(dòng)化。
這樣,無(wú)論是哪一個(gè)平臺(tái)的開發(fā)者,都能在自己熟悉的環(huán)境里開發(fā)Agent應(yīng)用。而對(duì)于大企業(yè),他們的服務(wù)和應(yīng)用就可在Windows、Linux、Android等多個(gè)系統(tǒng)間無(wú)縫切換,這助力了Agent普及。
此外,AgentBay積極擁抱開源,支持開發(fā)者共建生態(tài);而且它支持MCPServer自由定制與托管,開發(fā)者和企業(yè)可以共同構(gòu)建專屬AgentBay生態(tài)。
據(jù)張獻(xiàn)濤博士透露,自四月上旬發(fā)布了AgentBay的邀測(cè)后,不到三個(gè)月已有超過1000家客戶使用AgentBay打造自己的Agent。一些頭部的Agent應(yīng)用廠商也在與阿里云合作對(duì)接。
03
足夠優(yōu)秀的專屬infra,
是Agent應(yīng)用生態(tài)持續(xù)繁榮的基石
AI領(lǐng)域現(xiàn)在最重要,也最繁榮的是整個(gè)技術(shù)棧的兩端:應(yīng)用和基礎(chǔ)設(shè)施。當(dāng)下的AI像極了移動(dòng)互聯(lián)網(wǎng)時(shí)代:當(dāng)時(shí)各類App層出不窮,促進(jìn)IT基礎(chǔ)設(shè)施邁進(jìn)了云計(jì)算時(shí)代。
現(xiàn)在我們看到了Agent應(yīng)用端的繁榮,無(wú)論是大廠,還是創(chuàng)業(yè)公司,都在Agent應(yīng)用領(lǐng)域耕耘;無(wú)論是通用Agent,專用Agent,還是各種定制Agent,創(chuàng)意天馬行空。
但是,應(yīng)用不是建立在空中樓閣上的,基礎(chǔ)設(shè)施的完善是應(yīng)用繁榮的基石,就像修好了高速公路和鐵路,才有物流和電商的繁榮;有了足夠的網(wǎng)絡(luò)基礎(chǔ)設(shè)施,才能創(chuàng)造出淘寶天貓、抖音、優(yōu)酷;有了足夠多的充電樁,才有新能源車的爆發(fā)。Agent應(yīng)用的繁榮和持續(xù)創(chuàng)新,需要足夠好的基礎(chǔ)設(shè)施來支撐。
阿里云不僅云服務(wù)在亞太地區(qū)占據(jù)最高的市場(chǎng)份額;根據(jù)IDC的報(bào)告,它在中國(guó)AI基礎(chǔ)設(shè)施市場(chǎng)獲得23%的市場(chǎng)份額,同樣排名第一。
AgentBay,不僅依托于阿里云深厚的云計(jì)算技術(shù)積累,而且基于對(duì)客戶需求的敏銳觀察打造,是支撐Agent應(yīng)用繁榮的基石中,最堅(jiān)實(shí)的一塊。
*頭圖來源:視覺中國(guó)
本文為極客公園原創(chuàng)文章,轉(zhuǎn)載請(qǐng)聯(lián)系極客君微信geekparkGO
極客一問
你如何看待無(wú)影AgentBay?
早年智駕測(cè)試有多拼?王興、張一鳴簽「生死狀」上車試駕沃爾沃。
點(diǎn)贊關(guān)注極客公園視頻號(hào),
數(shù)碼單反相機(jī)照片存儲(chǔ)格式深度解析:JPEG、RAW與TIFF的優(yōu)劣選擇
數(shù)碼單反相機(jī)拍攝的照片,通常以三種主要格式進(jìn)行保存: JPEG、 RAW和 TIFF|。在拍攝過程中,攝影師通??梢赃x擇將照片保存為JPEG或RAW格式,或者同時(shí)保存這兩種格式。? JPEG格式JPEG,全稱Joint Photographic Experts Group, ? RAW與JPG關(guān)系及處理在圖像生成后,相機(jī)通常會(huì)將該圖像壓縮成JPG格式進(jìn)行存儲(chǔ)__。但如果用戶啟用了相機(jī)的RAW功能,那么原始數(shù)據(jù)將被整理并與JPG圖像一起保存為一個(gè)RAW文件。若未啟用RAW功能,原始數(shù)據(jù)則會(huì)被忽略。? 調(diào)整與細(xì)節(jié)保留RAW格式通常以無(wú)壓縮或無(wú)損壓縮的形式存在,避免了JPG壓縮可能帶來的畫面損失。RAW與JPEG格式攝影指南:選擇與調(diào)整技巧