機(jī)器之心原創(chuàng)
PokeeAI公開(kāi)測(cè)試版現(xiàn)已正式上線!
「哈嘍,可以聽(tīng)到嗎?」北京時(shí)間上午10點(diǎn),大洋彼岸的Pokee.ai創(chuàng)始人朱哲清接通了我們的連線電話,此刻他正位于美國(guó)西海岸,當(dāng)?shù)貢r(shí)間為前一日晚上7點(diǎn)。
用他的話說(shuō)最近的狀態(tài)就是「忙」,非常忙。忙著發(fā)布Agent產(chǎn)品PokeeAI的公開(kāi)測(cè)試版,忙著處理第一輪融資的各種后續(xù)事宜,忙著對(duì)核心4人組團(tuán)隊(duì)「擴(kuò)張」至7人,忙里偷閑在小紅書慶祝自己29歲生日,并在評(píng)論下認(rèn)真回復(fù)網(wǎng)友提問(wèn)……
「忙」,或許不是從最近開(kāi)始的,往前數(shù)200多天,那時(shí)候也「忙」。忙著成立Pokee.ai,忙著與100多位投資人聊如何用強(qiáng)化學(xué)習(xí)模型構(gòu)建AIAgent,忙著準(zhǔn)備產(chǎn)品內(nèi)測(cè)。
再往前數(shù)到2017年,依舊是「忙」。一邊忙著在斯坦福攻讀強(qiáng)化學(xué)習(xí)方向博士學(xué)位。一邊忙著在Meta工作,帶領(lǐng)團(tuán)隊(duì)將強(qiáng)化學(xué)習(xí)落地到廣告競(jìng)價(jià)、自動(dòng)內(nèi)容生成等業(yè)務(wù),為公司帶來(lái)高額增收。
朱哲清似乎已經(jīng)習(xí)慣了「忙」??伤f(shuō),創(chuàng)業(yè)雖然忙,但有了更多的時(shí)間去思考,這是一種全新的體驗(yàn)……
創(chuàng)業(yè)是從去年10月開(kāi)始的,公司名為Pokee.ai,取自「小口袋」之意,寓指做一個(gè)輕便、決策能力強(qiáng)、隨叫隨到解決問(wèn)題的模型。公司整體定位是聚焦于開(kāi)發(fā)一款交互式、個(gè)性化、高效的AIAgent。
但較之主流以LLM為核心的AIAgent構(gòu)建方式,Pokee.ai是以RL為核心,用朱哲清的話說(shuō),在Pokee的架構(gòu)中,LLM主要是充當(dāng)人機(jī)交互界面,類似「UI層」,用以理解用戶意圖,而真正決策、執(zhí)行任務(wù)的全都是基于RL結(jié)構(gòu)完成。
但那是去年10月,OpenAI還沒(méi)有發(fā)布o(jì)1,將RL推向大眾,DeepSeek也還沒(méi)有引起全球狂歡。
在與大多數(shù)的投資人聊的時(shí)候,他們都覺(jué)得Pokee.ai這個(gè)方向是天方夜譚……如今,它已經(jīng)慢慢從「非共識(shí)」變成了「共識(shí)」,而Pokee.ai也邁進(jìn)新階段。
最新消息,Pokee.ai完成1200萬(wàn)美元種子輪融資,由Point72Ventures領(lǐng)投,PokeeAI的公開(kāi)測(cè)試版現(xiàn)已上線。
本周,在Pokee正式公測(cè)前,《機(jī)器之心》與朱哲清聊了聊,以下為對(duì)話內(nèi)容:
機(jī)器之心:Pokee.ai去年10月成立,如今產(chǎn)品正式公測(cè)、完成種子輪融資,這樣的節(jié)奏在你預(yù)期內(nèi)嗎?
朱哲清:整體節(jié)奏比較快,去年10月Pokee.AI成立,從概念驗(yàn)證,到通用Agent框架搭建,再到如今產(chǎn)品公測(cè)和融資宣布,其實(shí)也才7個(gè)多月。之前定的目標(biāo)是,今年上半年最重要的是做完產(chǎn)品第一輪公測(cè)、拿到種子輪融資,現(xiàn)在全部完成,總體來(lái)說(shuō)符合預(yù)期。
與Meta相比,節(jié)奏大概會(huì)快4—5倍,對(duì)我來(lái)說(shuō)生活和工作節(jié)奏沒(méi)有太大變化,甚至有更多時(shí)間去思考。我之前工作時(shí)同步在讀博士,那時(shí)候特別忙,一周可能要工作100多個(gè)小時(shí),現(xiàn)在還是100多個(gè)小時(shí),但思考的時(shí)間變多了。
機(jī)器之心:你做的事情其實(shí)很少有人做,你印象中投資人問(wèn)的最多的問(wèn)題是什么?
朱哲清:剛開(kāi)始和投資人聊的時(shí)候,總體感受就是他們不理解為什么要用一個(gè)跟別人不一樣的方式去做Agent,那時(shí)候RL又不火、DeepSeek也沒(méi)出來(lái)。當(dāng)我第一次跟投資人說(shuō)我們最終想做的是讓一個(gè)RLSystem變成一個(gè)像通用操作系統(tǒng)一樣的東西時(shí),他們都覺(jué)得這是天方夜譚。
機(jī)器之心:說(shuō)到做AIAgent的初衷,你曾說(shuō)Pokee.AI做的是「目標(biāo)不是像人一樣完成任務(wù),而是超過(guò)人類在某些任務(wù)中的策略選擇和規(guī)劃能力?!惯@是不是現(xiàn)在很火的ASI概念?
朱哲清:我覺(jué)得ASI與AGI的定義范疇其實(shí)很模糊,從某種意義上來(lái)說(shuō),我們可能已經(jīng)實(shí)現(xiàn)了ASI,如果給你一個(gè)100萬(wàn)Token的文章,人類要讀很久才能把它讀完,而模型只需要幾秒或幾十秒鐘就完成了,那從這個(gè)角度來(lái)說(shuō)它已經(jīng)SuperHumanIntelligence。
我們距離Agent「ChatGPT時(shí)刻」還有多遠(yuǎn)?
機(jī)器之心:在你看來(lái),一個(gè)通用Agent應(yīng)該具備哪些特點(diǎn)?
朱哲清:一個(gè)通用Agent的核心能力在于,不管是在什么場(chǎng)景下,要解決什么問(wèn)題,只要把prompt告訴它,它就可以把任務(wù)完成,而不需要事先去配置要用哪些工具。
我們的設(shè)想是,客戶給到一個(gè)prompt,說(shuō)這是我要做的事情需求,這家公司或者開(kāi)發(fā)者不需要處理,直接將prompt「扔」給Pokee,Pokee就根據(jù)prompt調(diào)用對(duì)應(yīng)工具,把問(wèn)題解決,將結(jié)果直接傳回給公司或開(kāi)發(fā)者,之后后者可以把內(nèi)容用更好的展現(xiàn)形式反饋會(huì)給客戶。
機(jī)器之心:可以理解為這是AIAgent的「ChatGPT時(shí)刻」嗎?現(xiàn)在處于什么階段?
朱哲清:是的,這是一個(gè)完完全全不需要人為配置的AIAgent,也是我們的最終設(shè)想?,F(xiàn)在的AIAgent需要的(工具)配置量很大,要匹配MCPServer、找工具,而在prompt下面可以加的工具很有限,也不能拼命加,那總體的訓(xùn)練量就很大。
機(jī)器之心:所以當(dāng)時(shí)創(chuàng)業(yè)是因?yàn)榭吹竭@些局限性,Pokee.ai是如何做的?
朱哲清:我們想做的就是如何能夠讓第三方開(kāi)發(fā)者在幾乎不需要做任何開(kāi)發(fā)的情況下完成AIAgent的搭建,不管是NoCode還是LowCode。NoCode是指Pokee直接跑一個(gè)prompt,得到工作流后,直接復(fù)制粘貼給無(wú)數(shù)個(gè)場(chǎng)景下面;LowCode,是指別人通過(guò)我們的接口把他們想要解決的問(wèn)題以Prompt形式傳過(guò)來(lái),從而把問(wèn)題解決了,也不用告訴我們要用什么工具。
機(jī)器之心:以RL為核心的AIAgent和以LLM為核心的AIAgent的差異性在哪里?
朱哲清:首先,當(dāng)下的很多LLM也用強(qiáng)化學(xué)習(xí),而我們做的強(qiáng)化學(xué)習(xí)模型的工具調(diào)用范圍和常規(guī)LLM模型的工具調(diào)用范圍不一樣,具體來(lái)說(shuō)是動(dòng)作空間(ActionSpace)的區(qū)別,就是LLM模型的動(dòng)作空間只有Token,而強(qiáng)化學(xué)習(xí)模型的動(dòng)作空間可能不是Token,是那些工具,直接通過(guò)工具本身的泛化性來(lái)完成對(duì)于AIAgent的搭建。
機(jī)器之心:在你對(duì)通用Agent的描述中,對(duì)prompt的要求很高,但似乎并不是每個(gè)人都會(huì)提問(wèn)題,如何看待這一現(xiàn)象?
朱哲清:是的,現(xiàn)在用戶在使用Pokee的時(shí)候也會(huì)遇到這個(gè)問(wèn)題,已經(jīng)把prompt給你了,可為什么你寫出來(lái)的東西不是我想要的?關(guān)鍵就在于,用戶給的prompt可能并不是他們的真正意圖,想做的和說(shuō)的是兩回事。
該如何理解意圖就叫做對(duì)齊(Alignment),這件事情非常難,因?yàn)闆](méi)有一個(gè)GroundTruth,每個(gè)人說(shuō)話方式都不一樣。如果真的想要找到GroundTruth,說(shuō)用戶一定指的是這件事情,那必須要通過(guò)和這個(gè)人的長(zhǎng)期Memory聯(lián)系起來(lái)才能夠找到。
如果我來(lái)評(píng)判這條路徑上該怎么走,就是先要能夠解決問(wèn)題,之后把用戶的非訓(xùn)練數(shù)據(jù)進(jìn)行個(gè)性化(personalization),然后要去理解、對(duì)齊。大概就是三步走——決策能力、對(duì)于Memory的personalization、Alignment。
機(jī)器之心:能否舉例說(shuō)一下?
朱哲清:比如之前投資人在試用我們產(chǎn)品時(shí),寫了一個(gè)Prompt——能不能幫我draft一個(gè)LinkedInPost?那這個(gè)「draft」的意思到底是「單純幫我寫好但不要發(fā)出去」還是「幫我寫好并直接發(fā)出去」?
要想了解他的真正意圖就需要去看過(guò)往給他的員工或者同事說(shuō)這句話的時(shí)候,他會(huì)怎么說(shuō),以及后者的回復(fù),通過(guò)他們之間的交互來(lái)確認(rèn)他說(shuō)「draft」的意思。這是很復(fù)雜的一件事情,需要非常個(gè)性化的Memory才能完成。
機(jī)器之心:那當(dāng)前處于哪一步?
朱哲清:整個(gè)行業(yè)第一步都還沒(méi)做完,更別說(shuō)二、三步了(笑)。
機(jī)器之心:基于此,該怎么做?
朱哲清:我覺(jué)得這是一個(gè)很有意義也非常前瞻的問(wèn)題,但從商業(yè)化角度來(lái)說(shuō),這不是第一優(yōu)先級(jí),最先聚焦的應(yīng)該是能不能解決問(wèn)題?先把問(wèn)題解決了,然后再往下探索能不能更好地理解(問(wèn)題)。
機(jī)器之心:據(jù)了解,Pokee的架構(gòu)是,將小型LLM作為人機(jī)交互界面,類似「UI層」,用于理解用戶意圖,而真正決策、執(zhí)行任務(wù)的全部基于強(qiáng)化學(xué)習(xí)結(jié)構(gòu)來(lái)完成?;谶@一理解,其實(shí)你們對(duì)于prompt的要求很高?
朱哲清:對(duì),這就復(fù)雜得多了,所以我一直說(shuō),LLM做得越好,我們就能做得越好。雖然我們是將RL而非LLM作為AIAgent核心,但我們與LLM并非競(jìng)爭(zhēng)關(guān)系,如果純語(yǔ)言方向不能變得更好,我們也會(huì)有瓶頸,根本無(wú)法完全完整地理解用戶到底要說(shuō)什么。
創(chuàng)業(yè),一個(gè)孤獨(dú)的漫長(zhǎng)旅程
機(jī)器之心:從離開(kāi)Meta開(kāi)始創(chuàng)業(yè)到現(xiàn)在有大半年時(shí)間,你覺(jué)得工作和創(chuàng)業(yè)有什么區(qū)別,最大的感受是什么?
朱哲清:區(qū)別很大,期間也有過(guò)掙扎,但不是因?yàn)闀r(shí)間管理、勞累,而是創(chuàng)業(yè)本身是一條很模糊的路,或者說(shuō)本來(lái)就沒(méi)有路,你想走成什么樣,它就是什么路。作為公司CEO,看似有很大的話語(yǔ)權(quán),你說(shuō)要往哪走就往哪走,但實(shí)際上能做的決策數(shù)量有限,要對(duì)公司、大家負(fù)責(zé)。
在大公司不一樣,可以做無(wú)數(shù)次決策,甚至可以換組,這個(gè)東西做不下去就換個(gè)方向。
機(jī)器之心:據(jù)了解,團(tuán)隊(duì)從成立到今年4、5月份一直是四人核心配置,現(xiàn)在有多少人?有沒(méi)有考慮擴(kuò)張?
朱哲清:目前團(tuán)隊(duì)有7個(gè)人,接下來(lái)還會(huì)招兩三個(gè)人,但是大概率在收入規(guī)模擴(kuò)大前不會(huì)將團(tuán)隊(duì)配置超過(guò)10個(gè)人。
機(jī)器之心:所以也可以說(shuō)AI時(shí)代的創(chuàng)業(yè)更為「輕量級(jí)」?
朱哲清:是的,AI時(shí)代,模型、產(chǎn)品打磨各方面其實(shí)用不了很多人,人多了,反而做事情會(huì)躡手躡腳。
機(jī)器之心:你們辦公室位于哪里?日常工作狀態(tài)是怎樣的?
朱哲清:我們沒(méi)有辦公室。
機(jī)器之心:那平時(shí)開(kāi)會(huì)也是線上?
朱哲清:全部線上,因?yàn)橛腥嗽谖餮艌D,有人在灣區(qū),還有人在新加坡,都不在一起。另外我們都是Meta出身,習(xí)慣了遠(yuǎn)程辦公,即便沒(méi)有辦公室,效率也挺高,而且還能兼顧生活?,F(xiàn)在,我們每天線上開(kāi)一個(gè)會(huì),要做什么,大家一起討論決定。
劉心武揭秘紅樓夢(mèng)|53.王熙鳳巧姐之謎??人生五味
百家講壇:《劉心武揭秘紅樓夢(mèng)Vl》
百家講壇《劉心武揭秘紅樓夢(mèng)》之秦可卿生存之謎