機器之心原創(chuàng)
PokeeAI公開測試版現(xiàn)已正式上線!
「哈嘍,可以聽到嗎?」北京時間上午10點,大洋彼岸的Pokee.ai創(chuàng)始人朱哲清接通了我們的連線電話,此刻他正位于美國西海岸,當?shù)貢r間為前一日晚上7點。
用他的話說最近的狀態(tài)就是「忙」,非常忙。忙著發(fā)布Agent產(chǎn)品PokeeAI的公開測試版,忙著處理第一輪融資的各種后續(xù)事宜,忙著對核心4人組團隊「擴張」至7人,忙里偷閑在小紅書慶祝自己29歲生日,并在評論下認真回復網(wǎng)友提問……
「忙」,或許不是從最近開始的,往前數(shù)200多天,那時候也「忙」。忙著成立Pokee.ai,忙著與100多位投資人聊如何用強化學習模型構建AIAgent,忙著準備產(chǎn)品內(nèi)測。
再往前數(shù)到2017年,依舊是「忙」。一邊忙著在斯坦福攻讀強化學習方向博士學位。一邊忙著在Meta工作,帶領團隊將強化學習落地到廣告競價、自動內(nèi)容生成等業(yè)務,為公司帶來高額增收。
朱哲清似乎已經(jīng)習慣了「忙」??伤f,創(chuàng)業(yè)雖然忙,但有了更多的時間去思考,這是一種全新的體驗……
創(chuàng)業(yè)是從去年10月開始的,公司名為Pokee.ai,取自「小口袋」之意,寓指做一個輕便、決策能力強、隨叫隨到解決問題的模型。公司整體定位是聚焦于開發(fā)一款交互式、個性化、高效的AIAgent。
但較之主流以LLM為核心的AIAgent構建方式,Pokee.ai是以RL為核心,用朱哲清的話說,在Pokee的架構中,LLM主要是充當人機交互界面,類似「UI層」,用以理解用戶意圖,而真正決策、執(zhí)行任務的全都是基于RL結構完成。
但那是去年10月,OpenAI還沒有發(fā)布o1,將RL推向大眾,DeepSeek也還沒有引起全球狂歡。
在與大多數(shù)的投資人聊的時候,他們都覺得Pokee.ai這個方向是天方夜譚……如今,它已經(jīng)慢慢從「非共識」變成了「共識」,而Pokee.ai也邁進新階段。
最新消息,Pokee.ai完成1200萬美元種子輪融資,由Point72Ventures領投,PokeeAI的公開測試版現(xiàn)已上線。
本周,在Pokee正式公測前,《機器之心》與朱哲清聊了聊,以下為對話內(nèi)容:
機器之心:Pokee.ai去年10月成立,如今產(chǎn)品正式公測、完成種子輪融資,這樣的節(jié)奏在你預期內(nèi)嗎?
朱哲清:整體節(jié)奏比較快,去年10月Pokee.AI成立,從概念驗證,到通用Agent框架搭建,再到如今產(chǎn)品公測和融資宣布,其實也才7個多月。之前定的目標是,今年上半年最重要的是做完產(chǎn)品第一輪公測、拿到種子輪融資,現(xiàn)在全部完成,總體來說符合預期。
與Meta相比,節(jié)奏大概會快4—5倍,對我來說生活和工作節(jié)奏沒有太大變化,甚至有更多時間去思考。我之前工作時同步在讀博士,那時候特別忙,一周可能要工作100多個小時,現(xiàn)在還是100多個小時,但思考的時間變多了。
機器之心:你做的事情其實很少有人做,你印象中投資人問的最多的問題是什么?
朱哲清:剛開始和投資人聊的時候,總體感受就是他們不理解為什么要用一個跟別人不一樣的方式去做Agent,那時候RL又不火、DeepSeek也沒出來。當我第一次跟投資人說我們最終想做的是讓一個RLSystem變成一個像通用操作系統(tǒng)一樣的東西時,他們都覺得這是天方夜譚。
機器之心:說到做AIAgent的初衷,你曾說Pokee.AI做的是「目標不是像人一樣完成任務,而是超過人類在某些任務中的策略選擇和規(guī)劃能力?!惯@是不是現(xiàn)在很火的ASI概念?
朱哲清:我覺得ASI與AGI的定義范疇其實很模糊,從某種意義上來說,我們可能已經(jīng)實現(xiàn)了ASI,如果給你一個100萬Token的文章,人類要讀很久才能把它讀完,而模型只需要幾秒或幾十秒鐘就完成了,那從這個角度來說它已經(jīng)SuperHumanIntelligence。
我們距離Agent「ChatGPT時刻」還有多遠?
機器之心:在你看來,一個通用Agent應該具備哪些特點?
朱哲清:一個通用Agent的核心能力在于,不管是在什么場景下,要解決什么問題,只要把prompt告訴它,它就可以把任務完成,而不需要事先去配置要用哪些工具。
我們的設想是,客戶給到一個prompt,說這是我要做的事情需求,這家公司或者開發(fā)者不需要處理,直接將prompt「扔」給Pokee,Pokee就根據(jù)prompt調(diào)用對應工具,把問題解決,將結果直接傳回給公司或開發(fā)者,之后后者可以把內(nèi)容用更好的展現(xiàn)形式反饋會給客戶。
機器之心:可以理解為這是AIAgent的「ChatGPT時刻」嗎?現(xiàn)在處于什么階段?
朱哲清:是的,這是一個完完全全不需要人為配置的AIAgent,也是我們的最終設想。現(xiàn)在的AIAgent需要的(工具)配置量很大,要匹配MCPServer、找工具,而在prompt下面可以加的工具很有限,也不能拼命加,那總體的訓練量就很大。
機器之心:所以當時創(chuàng)業(yè)是因為看到這些局限性,Pokee.ai是如何做的?
朱哲清:我們想做的就是如何能夠讓第三方開發(fā)者在幾乎不需要做任何開發(fā)的情況下完成AIAgent的搭建,不管是NoCode還是LowCode。NoCode是指Pokee直接跑一個prompt,得到工作流后,直接復制粘貼給無數(shù)個場景下面;LowCode,是指別人通過我們的接口把他們想要解決的問題以Prompt形式傳過來,從而把問題解決了,也不用告訴我們要用什么工具。
機器之心:以RL為核心的AIAgent和以LLM為核心的AIAgent的差異性在哪里?
朱哲清:首先,當下的很多LLM也用強化學習,而我們做的強化學習模型的工具調(diào)用范圍和常規(guī)LLM模型的工具調(diào)用范圍不一樣,具體來說是動作空間(ActionSpace)的區(qū)別,就是LLM模型的動作空間只有Token,而強化學習模型的動作空間可能不是Token,是那些工具,直接通過工具本身的泛化性來完成對于AIAgent的搭建。
機器之心:在你對通用Agent的描述中,對prompt的要求很高,但似乎并不是每個人都會提問題,如何看待這一現(xiàn)象?
朱哲清:是的,現(xiàn)在用戶在使用Pokee的時候也會遇到這個問題,已經(jīng)把prompt給你了,可為什么你寫出來的東西不是我想要的?關鍵就在于,用戶給的prompt可能并不是他們的真正意圖,想做的和說的是兩回事。
該如何理解意圖就叫做對齊(Alignment),這件事情非常難,因為沒有一個GroundTruth,每個人說話方式都不一樣。如果真的想要找到GroundTruth,說用戶一定指的是這件事情,那必須要通過和這個人的長期Memory聯(lián)系起來才能夠找到。
如果我來評判這條路徑上該怎么走,就是先要能夠解決問題,之后把用戶的非訓練數(shù)據(jù)進行個性化(personalization),然后要去理解、對齊。大概就是三步走——決策能力、對于Memory的personalization、Alignment。
機器之心:能否舉例說一下?
朱哲清:比如之前投資人在試用我們產(chǎn)品時,寫了一個Prompt——能不能幫我draft一個LinkedInPost?那這個「draft」的意思到底是「單純幫我寫好但不要發(fā)出去」還是「幫我寫好并直接發(fā)出去」?
要想了解他的真正意圖就需要去看過往給他的員工或者同事說這句話的時候,他會怎么說,以及后者的回復,通過他們之間的交互來確認他說「draft」的意思。這是很復雜的一件事情,需要非常個性化的Memory才能完成。
機器之心:那當前處于哪一步?
朱哲清:整個行業(yè)第一步都還沒做完,更別說二、三步了(笑)。
機器之心:基于此,該怎么做?
朱哲清:我覺得這是一個很有意義也非常前瞻的問題,但從商業(yè)化角度來說,這不是第一優(yōu)先級,最先聚焦的應該是能不能解決問題?先把問題解決了,然后再往下探索能不能更好地理解(問題)。
機器之心:據(jù)了解,Pokee的架構是,將小型LLM作為人機交互界面,類似「UI層」,用于理解用戶意圖,而真正決策、執(zhí)行任務的全部基于強化學習結構來完成?;谶@一理解,其實你們對于prompt的要求很高?
朱哲清:對,這就復雜得多了,所以我一直說,LLM做得越好,我們就能做得越好。雖然我們是將RL而非LLM作為AIAgent核心,但我們與LLM并非競爭關系,如果純語言方向不能變得更好,我們也會有瓶頸,根本無法完全完整地理解用戶到底要說什么。
創(chuàng)業(yè),一個孤獨的漫長旅程
機器之心:從離開Meta開始創(chuàng)業(yè)到現(xiàn)在有大半年時間,你覺得工作和創(chuàng)業(yè)有什么區(qū)別,最大的感受是什么?
朱哲清:區(qū)別很大,期間也有過掙扎,但不是因為時間管理、勞累,而是創(chuàng)業(yè)本身是一條很模糊的路,或者說本來就沒有路,你想走成什么樣,它就是什么路。作為公司CEO,看似有很大的話語權,你說要往哪走就往哪走,但實際上能做的決策數(shù)量有限,要對公司、大家負責。
在大公司不一樣,可以做無數(shù)次決策,甚至可以換組,這個東西做不下去就換個方向。
機器之心:據(jù)了解,團隊從成立到今年4、5月份一直是四人核心配置,現(xiàn)在有多少人?有沒有考慮擴張?
朱哲清:目前團隊有7個人,接下來還會招兩三個人,但是大概率在收入規(guī)模擴大前不會將團隊配置超過10個人。
機器之心:所以也可以說AI時代的創(chuàng)業(yè)更為「輕量級」?
朱哲清:是的,AI時代,模型、產(chǎn)品打磨各方面其實用不了很多人,人多了,反而做事情會躡手躡腳。
機器之心:你們辦公室位于哪里?日常工作狀態(tài)是怎樣的?
朱哲清:我們沒有辦公室。
機器之心:那平時開會也是線上?
朱哲清:全部線上,因為有人在西雅圖,有人在灣區(qū),還有人在新加坡,都不在一起。另外我們都是Meta出身,習慣了遠程辦公,即便沒有辦公室,效率也挺高,而且還能兼顧生活。現(xiàn)在,我們每天線上開一個會,要做什么,大家一起討論決定。
「七篇綜漫言情小說」突然不腦愛戀了怎么辦?
5本好看的主角控小說,正派反派都對主角有超高好感度,十分蘇爽
中秋團圓夜的溫暖小說推薦
免責聲明:本文內(nèi)容由開放的智能模型自動生成,僅供參考。