夙智美
文|硅谷101
美國時間7月17日,OpenAI終于迎來了它的“Agent時刻”——通用型ChatGPTAgent正式發(fā)布。它整合了深度研究工具DeepResearch與執(zhí)行工具Operator,可一站式完成復雜任務,但仍存在速度慢、個性化不足等短板。這款產(chǎn)品的發(fā)布,讓市場重新審視通用AI代理的技術(shù)路徑選擇。
ChatGPTAgent的架構(gòu)本質(zhì)是“瀏覽器+沙盒虛擬機”,與Manus、Genspark形成鮮明的技術(shù)路線差異。在底層架構(gòu)層面,瀏覽器(Browser-based)代理雖堪稱萬能,但運行速度較慢;沙盒虛擬機(Sandbox)高效,但無法聯(lián)網(wǎng)操作、工具庫受限;工作流集成(WorkflowAPI)速度快、結(jié)果精準,但業(yè)務范圍有限。
不同架構(gòu)模式下的幾大主流Agent,各有哪些優(yōu)劣勢?針對B端客戶和C端客戶的Agent產(chǎn)品,在適用場景和技術(shù)邏輯上有何差別?Agent將重塑互聯(lián)網(wǎng)入口,那么依靠廣告營收的創(chuàng)作者們將如何維持商業(yè)模式?本期《硅谷101》,主播泓君對話Pokee.ai創(chuàng)始人、前MetaAI應用強化學習團隊負責人朱哲清,深入拆解Agent的技術(shù)邏輯與未來趨勢(這期內(nèi)容非常干貨,我們將分為上下兩集進行推送~)。
以下是這次對話內(nèi)容的精選:
01主流底層架構(gòu)對比:瀏覽器、沙盒環(huán)境、工作流
泓君:和市面上的通用型AIAgent對比,你覺得ChatGPTAgent的主要區(qū)別是什么?市面上所有通用型的AIAgent,它們的優(yōu)劣勢分別是什么?我相信它們在解決不同場景的問題上,還是會有一些區(qū)分度。
來源:ChatGPT
朱哲清:目前的通用Agent包括這么幾家:一個是Perplexity,一個是OpenAI;Anthropic現(xiàn)在還沒有推出自己的通用Agent,但他們有編程的Agent;我們Pokee相對比較小一些,比較晚期才出來;有Manus,有Genspark,可能更偏向垂直一些。
首先,目前在基于瀏覽器的產(chǎn)品中,能力最強的還是OpenAI,特別是它把深度研究和瀏覽器操作加在一塊以后。如果你去看一些基準測試里面,比如說像最新出來的BrowsingCamp(一項瀏覽器智能體的基準測試),它能夠在BrowsingCamp上面達到50%多的BenchmarkScore(基準分數(shù)),而別的最高現(xiàn)在目前也只有20多分,在開源環(huán)境下。
圖源:ChatGPT
朱哲清:在瀏覽器(Browser)真正的執(zhí)行層面,Operator做得還是相對比較好的,因為當年的Operator是跟很多有API(應用程序接口)、有虛擬機的環(huán)境去對比的,它只有一個瀏覽器;現(xiàn)在Operator加上虛擬機的能力以后,應該會超越市面上別的一些工具的瀏覽器加虛擬機。
它唯一的一個比較麻煩的點是,OpenAI的瀏覽器嘗試做太多事情,它什么東西都想往瀏覽器里面塞。Manus也用瀏覽器,在另外一個方向完全只有大模型(LM),然后再加上一些執(zhí)行,可能是也能算虛擬機,但它是一個有限的虛擬機,它并不是可以導航(navigate)整個系統(tǒng)里的所有的程序包(Package),它是有些預設的程序包,然后去做這件事情的。
來源:Perplexity
Perplexity在瀏覽器里面做了一個相對比較另類的,它的瀏覽器不是說“我做一個能夠?qū)Ш綖g覽器的Agent”,而是說用戶在使用瀏覽器的時候,它給你一個助手,讓你去說“我需要在這個頁面上做些什么”,然后去幫你執(zhí)行。
02四大底層架構(gòu)解析,瀏覽器更萬能,虛擬機更高效
泓君:你提到了基于瀏覽器(Browser-based)跟沙盒(Sandbox)的這兩種搭建方式,那么現(xiàn)在AIAgent的搭建有哪幾種底層架構(gòu)?
注:“沙盒”(Sandbox)是限制AI行動范圍的隔離環(huán)境,“虛擬機”(VirtualMachine/VM)是構(gòu)建沙盒環(huán)境的一種方式。播客中,朱哲清以使用英文“Sandbox”為主,而主播泓君部分用中文“虛擬機”指代,本文稿根據(jù)具體語境翻譯這組概念。
朱哲清:現(xiàn)在的Agent有四種大的方向:第一種是基于瀏覽器的Agent。第二種是瀏覽器加沙盒的Agent,在這種Agent里面,會有很多通過沙盒里面的代碼以及命令行來完成的操作。第三種是只有沙盒,但是在沙盒內(nèi)部有非常大的限制的那種Agent,主要通過大模型的能力去生成代碼,并且只能運行特定類型的代碼。最后一種,是可以橫跨很多工具集成的Agent。
我認為瀏覽器(Browser)的意義在于,世界上所有的網(wǎng)頁和互聯(lián)網(wǎng)服務,都可以集中呈現(xiàn)在某個頁面,所以我只需要我的Agent能夠看到網(wǎng)頁、去操作網(wǎng)頁,我就可以完成我的任務。用戶可以看到這個基于瀏覽器的Agent在頁面上點了哪些地方,一頁一頁地去看瀏覽器是不是跟人一樣在操作網(wǎng)頁。
它的缺點是很慢,而且Token消耗特別高,原因在于你去看一個網(wǎng)頁,等于把HTML的文件直接拉下來,可能還包含一些腳本(script),然后把它全部拉下來,從零開始全部讀一遍,只為了操作一個網(wǎng)頁。但是它確實是萬能的。
來源:ChatGPT
朱哲清:第二種是沙盒(Sandbox)。沙盒的意義是可以線下寫Python腳本(script),直接在沙盒環(huán)境里去跑腳本來完成一些任務。比如你要去做數(shù)據(jù)分析,你完全可以直接告訴沙盒說“我有這個文件,它的抬頭是……”假設是銷售文件,抬頭是時間、每周銷售、品類各種各樣的抬頭,你得到這個文件以后,直接問沙盒“能不能照著這個,幫我做一個每周對比的銷售分析”。它給你寫個Python腳本,然后就幫你運行、得到結(jié)果。
沙盒環(huán)境的好處在于,它可以運行任何不需要聯(lián)網(wǎng)的、開源的程序包;但它的缺點在于,它很多情況下無法訪問互聯(lián)網(wǎng),特別是那種需要認證的產(chǎn)品。比如,你要去登錄你的Facebook,這些東西它都肯定做不到。
沙盒環(huán)境,來源:SandboxiePlus
朱哲清:第三種,是大模型加沙盒放一塊的Agent,它可能是限制一個大環(huán)境。Genspark是一個這樣的例子,它并不給你完整的一個沙盒,連瀏覽器都沒有。Genspark有一個大模型作為主體的推理過程,它寫代碼也完全靠這個大模型;有一個沙盒去運行一些代碼、生成一些東西,然后再把它渲染出來。但那個沙盒甚至不能被稱為一個沙盒,因為它是個非常有限的環(huán)境,只有三四個程序包。它是完全控制的,這個環(huán)境內(nèi)部無法說“現(xiàn)在去下載一個開源的程序包”“現(xiàn)在需要臨時去修改一張圖片”等任務。如果在它原始的程序包設計里面沒有,它自己不會下載一個程序包,然后去做這件事。
來源:Genspark
朱哲清:所以Genspark這種設計是,比如說像那種幻燈片Agent、表格Agent,它們在設計的時候把可用的包裹給限制住,不再讓用戶去用更多的程序包,是一個相對比較封閉的環(huán)境和工作流程——在限制環(huán)境下用一個大模型做主體寫代碼,同時用一個小的環(huán)境去執(zhí)行。
最后一種,可能和我們還有以前的Zapier和UIPath這種,是工作流式的,但是工作流內(nèi)部的每一個節(jié)點,是通過第三方服務提供商的直接集成來完成的。優(yōu)勢在于,可以保證每個服務的交付非??煽俊R驗榈谌椒眨热鏔acebook,是Facebook給我們的訪問權(quán)限,不會出錯。但與此同時,它有它的限制,如果用戶想在個人的Facebook賬戶上發(fā)圖片,那我們做不到,因為Facebook只讓創(chuàng)作者和商業(yè)用戶去自動化地發(fā)帖。
來源:Zapier
朱哲清:所以有這么四種類型,第二種和第三種之間的邊界是很模糊的。唯一的區(qū)別在于:第二種的虛擬機是大模型執(zhí)行完了以后,它所能夠給你使用的虛擬機是幾乎開放的,你自己可以選擇說我要去下載新的程序包再去執(zhí)行。所以虛擬機本身的能力是整個能力的主體。而第三種,可能是大模型的能力在現(xiàn)有程序包底下能生成什么代碼,已經(jīng)是限制了整個Agent能力的主體了。
03用戶體驗差異化,速度與通用性的平衡藝術(shù)
泓君:從用戶使用體驗上來說,Pokee、Genspark、Manus和OpenAI的ChatGPTAgent有什么明顯的區(qū)別嗎?
朱哲清:有蠻多地方都還蠻不一樣的。
Manus的體驗是,它盡可能用一個虛擬機加上瀏覽器的環(huán)境,來搭建一個幾乎讓人覺得萬能的環(huán)境。我有一個大模型作為一個規(guī)劃主題,規(guī)劃完、進入到瀏覽器以后,它是另外一個Agent,再完成瀏覽器導航,再總結(jié)得到的信息,再去進虛擬機做執(zhí)行。如果有必要的話,它確實可以做很多事情、理論上可以涵蓋市面上你所需要的所有功能。
與此同時,Manus的一個缺陷是被瀏覽器的能力所限制住了。比如,你要去真的發(fā)個帖,它做不到,因為它對于整個頁面的導航,說我要去選擇那個小的按鈕,選擇完之后去上傳一個圖片、生成一個視頻等,這很難;你要把谷歌表格里的某個單元格改成某種格式,也比較難,因為注意力的空間太小了,瀏覽器是它的一個主要限制。
第二個缺陷是它很慢,這是Manus和ChatGPTAgent的一個通病,因為用了瀏覽器,所以它的速度會非常慢——30多分鐘做一個任務。
來源:Manus
泓君:30多分鐘我覺得還是快的。我最開始使用的時候可能是一兩個小時,但那個時候非常早。
朱哲清:現(xiàn)在肯定比以前要快,因為整個基建什么的都上來了。但是它的瓶頸會在那,它的瓶頸甚至最后變成網(wǎng)頁調(diào)用,你加載一個網(wǎng)頁本身可能需要三四秒,這個是跳不掉的。
ChatGPT的優(yōu)勢在于DeepResearch做得好,能夠做出一個很詳盡的報告。你如果通過這個報告再去執(zhí)行某些任務,它會變得更全面一些。Manus的總體優(yōu)勢在于虛擬機的環(huán)境搭得可能比ChatGPT更好一些,但這個我還需要更詳盡地去研究,因為我還不太清楚ChatGPT里面的虛擬機能做到什么程度,但我猜應該Manus在虛擬機里面已經(jīng)花了很多精力去部署,應該會有一個比較小的優(yōu)勢。
來源:ChatGPT
朱哲清:Genspark一開始有個超級Agent,幾乎可以做任何事情,但它后面能夠處理的工具數(shù)量變得有限,所以它開始做模板。比如,幻燈片是一個Agent,AI調(diào)用是一個Agent,表格是一個Agent,瀏覽器也單獨做了一個Agent。在同一個用例下面,它把用戶體驗作為核心目標,然后做一些模板。不管你問什么問題,它總是用這樣的模板去生成幻燈片,總是用這些工具去搜索信息,使得它變得相對標化,越來越不是一個通用Agent。但它速度確實要比Manus和ChatGPT快一些,原因是它沒有那么大的瀏覽器導航,同時它的虛擬機本身是非常有限制的,只有少量工具在某一個Agent里面。
泓君:這樣是不是也更節(jié)省Token?
朱哲清:對,會相對節(jié)省一些Token。
泓君:它把大任務都拆成了細分的垂直的小任務。我猜它想做的是,當它把應用場景逐個完善,就可能類似于一個承載了很多小任務的大平臺。
朱哲清:它會變成一個類似于微信小程序的存在。
Pokee最大的不同是,它可能是目前所有的Agent里面最快的——總體速度應該在市面上所有產(chǎn)品的4-10倍左右。我們有個正在開發(fā)中的DeepResearchAgent,最后會有我們自己的DeepResearchAgent,加上我們的執(zhí)行Agent放在一塊,總體體驗會有大幅提升。
圖源:Pokee
朱哲清:為什么可以做到?原因是我們不再需要用非常復雜的虛擬機和ToolCalling(工具調(diào)用),而是直接用第三方集成的SDK(軟件開發(fā)工具包)和工具。通過我們自己的ToolCalling基礎模型去調(diào)用這些函數(shù),它的整體速度會大幅提升;沒有了像MCP和現(xiàn)在市面上的ToolCalling里極其復雜的上下文問題,每次整體調(diào)用成本能削減50%-60%;再加上我們自己的上下文的工程,使得整個的成本在市面上至少跟OpenAI的ChatGPTAgent和Manus相比,是個數(shù)量級的差距;跟Genspark等垂直化的Agent相比,可能是幾倍的差距。
在Token使用上,我們確實存在劣勢,特別是跟基于瀏覽器的Agent相比,我們并不是完全萬能的。比如要到Facebook、Instagram發(fā)帖,你必須是創(chuàng)作者賬號或者是企業(yè)賬戶,個人賬戶沒有辦法發(fā)帖。
泓君:只有企業(yè)用戶才能使用你們的Agent嗎?因為比如說,你在接Instagram和Facebook接口的時候,它提供的是一個企業(yè)用戶才能操作的界面嗎?
來源:@AliMirza(YouTube)
朱哲清:是創(chuàng)作者或者企業(yè)賬戶。他們希望能夠更多地去創(chuàng)作,但平臺不希望個人用戶全都用Agent發(fā)帖。這是符合商業(yè)邏輯的,因為如果所有個人用戶都通過一個Agent,想辦法用瀏覽器去破解Facebook、Instagram賬戶,或者破解某一個平臺,比如通過Agent爬蟲網(wǎng)頁來完成一個任務,那以后要是沒人上Facebook和Instagram了,對于平臺來說就是一個損失;它們希望個人用戶仍然每天去Facebook和Instagram上瀏覽帖子,然后再去發(fā)帖,這樣能有參與度。
以前,有人通過非常復雜的寫代碼的方式完成產(chǎn)品上傳,那現(xiàn)在會有人直接寫一段文字,然后直接把視頻創(chuàng)意上傳到這些平臺,別的平臺也一樣。它給你開放的權(quán)限,是他們認為開發(fā)者和非消費者用戶真正最需要、用得上的一些工具。如果你可以把這些都放進Agent里面,那些原來會使用這些工具的人,它會轉(zhuǎn)過來說,我寫一行提示詞就行了,不再需要寫那么多代碼。
04專業(yè)端VS非專業(yè)端,技術(shù)選擇分野
泓君:在我的理解中,像Manus、Genspark還有ChatGPTAgent,它們的商業(yè)模式是ToC的,而你的商業(yè)模式聽起來更偏ToB。
朱哲清:現(xiàn)在這個時代下,B端和C端的模糊性很高,但我們的產(chǎn)品一定是專業(yè)人士來使用的。對于專業(yè)人士以下的消費者用戶,它們使用一款非常省時間的AIAgent的概率不是很高,這也是市面上很多AIAgent的感知非常差的原因。因為它沒有重復性,很多的工作流用一次就結(jié)束了。而我們目前的很多用戶每周都會跑一模一樣的工作,我們發(fā)現(xiàn)這種使用有重復性。
來源:Pokee
泓君:這個是不是也很取決于平臺會給你們開放什么樣的SDK(軟件開發(fā)工具包)和API(應用程序接口)?假設我每天的微信太多了,希望有一個Agent幫我管理所有信息、回復一些比較基礎的信息,前提還是微信要給這樣的Agent開放它的接口。那它們愿意把這些接口開放給開發(fā)者嗎?
朱哲清:在美國,像這種開發(fā)者的社區(qū),是很多大公司、特別是科技公司所崇尚的一個方向,所以大多數(shù)公司都有非常完善的接口和開發(fā)工具包,甚至于說他們給到你的是個非常簡單的爬蟲結(jié)構(gòu),它也不給你Python開發(fā)工具包之類。國內(nèi)公司可能相對差一些,很多接口不開放給你。但微信的話,比如企業(yè)微信創(chuàng)作者那種級別的微信,也會把接口放給你,你也可以自動回復,什么都有。
國內(nèi)的整個生態(tài)也在慢慢在開放,特別是MCP(多智能體協(xié)作協(xié)議)這波出來了以后,有很多公司都開始被迫開放他們的SDK跟API,比如高德地圖是一個例子。之前可能沒有那么開放的高德地圖,后面在MCP出來了以后,它首先把地圖生態(tài)完全打開了,有蠻多這樣的例子。目前,有些公司給我們開放的API或者接口是獨家的,但有一些不是。
來源:高德開放平臺
朱哲清:總體來說,這個商業(yè)模式一定是偏專業(yè)人士的,原因在于,許多C端場景具有極強的瀏覽器導向特征。比如說你去瀏覽網(wǎng)頁規(guī)劃出差,相關(guān)需求往往是標準化的——像每兩周需飛往灣區(qū)、且每次入住同一家酒店,那系統(tǒng)可以每兩周幫你買一次這個機票。
但如果是一個消費者出去旅行,它就有很多變數(shù)。我可能是為了探索新東西,住宿上希望嘗試新的酒店,航班選擇也可能存在變數(shù),比如說今天我剛發(fā)了獎金,我就要飛商務艙了。所以這種用例它本身更適合基于瀏覽器的Agent,因為用戶面前有筆記本電腦,可以開瀏覽器去做事情。
05Agent重塑互聯(lián)網(wǎng)入口,流量分發(fā)的深度變革
泓君:在你跟大公司合作的過程中,它們開放API接口的動力是什么?
朱哲清:首先,整個Agent浪潮會從某種意義上取代正常的Web流量,過往可能是一個人打開一個瀏覽器,然后在谷歌搜索里面打入一段搜索,得到這個搜索結(jié)果以后,點一個網(wǎng)頁,再去做某件事情。但未來可能是,消費者端你打開ChatGPT,專業(yè)人士端你打開Pokee,你可能打一段字說,“今天早上我看到了回復CEO關(guān)于用戶增長的采訪,你能不能直接把YouTube上面的腳本直接拉下來,幫我寫一段報告,告訴我它增長策略的關(guān)鍵要點是什么?”然后它直接做完了整個流程——我從來沒有打開過YouTube,一個Agent從頭到尾做完了這件事。
可能你以后購物的用例也是一樣,你可能從頭到尾只是打開了ChatGPT,說“我明天要去一個晚宴,需要一套正裝”。它已經(jīng)知道了你的身材是什么樣子的,就自動幫你找到了最合適的衣服,并試穿在你的身上。你看一眼,覺得好,然后說現(xiàn)在有個折扣,就付款了,可能是這樣的流程。
來源:Wired
它給我們的啟示是:以前的工作流已經(jīng)被改變了,它們不再是通過瀏覽器去啟動整個工作流的開端,去下單或者獲得信息,然后再進入另外一個網(wǎng)頁進行操作。在接下來一到兩年內(nèi),大多數(shù)門戶網(wǎng)站,無論電商、搜索、視頻網(wǎng)站,還是其他門戶網(wǎng)站,流量一定會迅速下降,而入口變成了各個方向的Agent。
這就是當時谷歌要推出A2A(Agent-to-AgentProtocol,代理間通信協(xié)議)的原因。每一家公司都可能會有自己的Agent,可能是Agent跟Agent之間的交互,如果它能占用這個協(xié)議,在Gemini里搶先完成協(xié)議部署,最后它就會是最大的贏家,因為它成為了Agent入口。ChatGPT、Claude和我們Pokee也是一樣,推出協(xié)議的核心目的是占據(jù)Agent入口。
泓君:你們?yōu)槭裁聪胱约和瞥鰠f(xié)議,而不是接一個標準的MCP協(xié)議?這樣大家都是統(tǒng)一用的,你也可以在一個更大的生態(tài)里直接接入很多已經(jīng)接好了的APP。
朱哲清:MCP現(xiàn)在的可用性很差:當前市面上應該有接近2萬個MCP了,其中可用的MCP大概不到200個,而且大多數(shù)MCP都無人維護,這導致大多數(shù)公司不愿意花時間去做MCP協(xié)議。
我們的目標是,公司不再需要做MCP協(xié)議,你也不需要自己去做一個MCP服務器,就直接把開發(fā)API給我們,我們處理剩下的事。所以在服務提供商層面,公司什么也不用干,就可以得到額外的流量入口。
來源:騰訊云官方社區(qū)
泓君:未來在接入了Agent以后,互聯(lián)網(wǎng)會發(fā)生什么樣的形態(tài)變化?你覺得未來對創(chuàng)作者的影響是什么?如果我現(xiàn)在做一檔播客,比如我們上一期內(nèi)容里面,有一個騰訊算法廣告大賽的口播廣告。只有更多人聽這個播客,大家才可以聽到這個廣告,才能支撐一個播客的商業(yè)模式運轉(zhuǎn)下去、把這檔節(jié)目持續(xù)運營下去。還有人在下面說,這期播客為什么沒有開AI總結(jié)?如果沒有這樣一個過程,觀眾就不去聽這期播客了,就直接去看AI總結(jié)。這對廣告來說是一種流量的折損。
朱哲清:我覺得廣告這個行業(yè)會永遠存在,但它的形式會發(fā)生改變。當前,市面上有很多專注于廣告的AI公司,它們想要去看在大語言模型時代或者Agent時代,廣告要如何植入。
我舉個簡單例子,在播客里插播廣告這件事,未來會變成什么樣?現(xiàn)在的播客大多數(shù)除了平臺方收你錢以外,播客提供者本身是不收費的。比如說《硅谷101》是一個播客,但是大家都是免費聽的,如果你在YouTube上只是用了YouTube的廣告,然后YouTube通過廣告給你們分成。
來源:@TeamYouTube(X)
朱哲清:那未來可能變成我們需要去訪問你的播客,它本身的知識產(chǎn)權(quán)就是值錢的。每一次通過調(diào)用也好,通過網(wǎng)頁訪問也好,去找到你們這個播客的時候,或者是得到你這個信息的那一刻,任何的Agent方就要向你付款,你不再需要去擔任廣告流量的負責方,廣告是由Agent來完成的。Agent獲取信息后,在給用戶推薦其他Agent時,比如讓用戶選哪個Agent試用時,可以通過排名推薦收被推薦方的錢。而支持每個API、每個第三方的插件的產(chǎn)品本身,或者說知識產(chǎn)權(quán)本身是可以直接收費的。
所以對于創(chuàng)作者生態(tài)以及SaaS(SoftwareasaService,軟件即服務)生態(tài),從某種意義上來說是變好了,而不是變差了。你不再需要去在谷歌上面投廣告,也不再需要去免費地把你的內(nèi)容發(fā)給YouTube,讓它去幫你投放,而是有一個Agent直接向你付費,通過它自己的廣告機制去覆蓋它自己的成本。我不覺得你們會受到很大的沖擊。
泓君:整體上我覺得流量分成的模式會變得越來越弱。然后,如果Agent調(diào)用了很多創(chuàng)作者的內(nèi)容,怎么給創(chuàng)作者付費?這是未來可能會討論的一個問題。我稍微有一點疑問的是?;诹髁康倪@套方式,比如說你有推薦算法,一個頁面可以顯示10條播客的內(nèi)容或者視頻信息,但是Agent在回答一個問題的時候,還是比較精準聚焦,可能引用的范圍就相對更小了。
傳統(tǒng)搜索引擎推薦,來源:wordstream
朱哲清:上禮拜在ICML(InternationalConferenceonMachineLearning,機器學習國際會議)的時候,有一個專門做推薦系統(tǒng)的人,我們倆聊到了這件事情。我當時說,推薦系統(tǒng)的大方向可能會受到巨大擠壓。
在Agent的整個框架下面,它還是個推薦系統(tǒng)的一個端到端的決策過程,但是它每一次給你的交互只是給一條信息的結(jié)果,或者說幾條最相關(guān)信息的結(jié)果。這個時候它的整個決策線不再是按照排行第一、第二、第三這樣的方式去決策了,而是時間是它的決策點,因為一個人和一個Agent之間的交互總時長是基本固定的。Agent好,我就會交互時間久一點,它的目標可能是在每一個時間點上,我給你推薦的東西可以讓你所消費的時間和能夠得到的回報成正比。這個時候,它的整個原始的推薦系統(tǒng)算法可能就不那么成立了,因為原來推薦系統(tǒng)算法是說,我可能每一條點擊的概率是跟排行成正比的。
而現(xiàn)在變成,我每一次給你推薦或者給你回復的這個信息,基本上都是你必定會去點的東西,但是你會有第二輪跟我交互的過程。下一次你花這個時間跟我交互,我所占用這個時間成本,給你推薦的這一條就必須是最精確的。這樣會使得你跟我有更多的交互,所以它的目標可能就從“有五條、十條在一個頁面給你呈現(xiàn)”,變成了“有五輪、十輪的對話,每一輪的目標是讓你跟我做下一輪交互”。這個時候就跟傳統(tǒng)推薦系統(tǒng)的算法完全不一樣。
來源:Pexels
朱哲清:所以當時我說,我覺得整個推薦系統(tǒng),特別是這種基于排名的推薦系統(tǒng)的長期發(fā)展?jié)摿赡軙粯O度壓縮。因為它可能沒有排名,而更多是一個連續(xù)的、基于體驗、基于探索的交互機制。
它可能唯一的目標就是,每一條我都給你最精確的,能夠在不損失我未來機會成本的情況下,在同等級別的內(nèi)容里,選擇一個我可以有更多收入的內(nèi)容,當然我也不是100%確定這個一定是未來的方向,但我個人從目前的Agent發(fā)展趨勢來說,感覺是這么一個方向。
來源:紅網(wǎng)
作者:余飛蓮
編輯:孔惠然
本文為紅辣椒評論 原創(chuàng)文章,僅系作者個人觀點,不代表紅網(wǎng)立場。轉(zhuǎn)載請附原文出處鏈接和本聲明。