湛豐
機器之心原創(chuàng)
PokeeAI公開測試版現(xiàn)已正式上線!
「哈嘍,可以聽到嗎?」北京時間上午10點,大洋彼岸的Pokee.ai創(chuàng)始人朱哲清接通了我們的連線電話,此刻他正位于美國西海岸,當?shù)貢r間為前一日晚上7點。
用他的話說最近的狀態(tài)就是「忙」,非常忙。忙著發(fā)布Agent產品PokeeAI的公開測試版,忙著處理第一輪融資的各種后續(xù)事宜,忙著對核心4人組團隊「擴張」至7人,忙里偷閑在小紅書慶祝自己29歲生日,并在評論下認真回復網友提問……
「忙」,或許不是從最近開始的,往前數(shù)200多天,那時候也「忙」。忙著成立Pokee.ai,忙著與100多位投資人聊如何用強化學習模型構建AIAgent,忙著準備產品內測。
再往前數(shù)到2017年,依舊是「忙」。一邊忙著在斯坦福攻讀強化學習方向博士學位。一邊忙著在Meta工作,帶領團隊將強化學習落地到廣告競價、自動內容生成等業(yè)務,為公司帶來高額增收。
朱哲清似乎已經習慣了「忙」??伤f,創(chuàng)業(yè)雖然忙,但有了更多的時間去思考,這是一種全新的體驗……
創(chuàng)業(yè)是從去年10月開始的,公司名為Pokee.ai,取自「小口袋」之意,寓指做一個輕便、決策能力強、隨叫隨到解決問題的模型。公司整體定位是聚焦于開發(fā)一款交互式、個性化、高效的AIAgent。
但較之主流以LLM為核心的AIAgent構建方式,Pokee.ai是以RL為核心,用朱哲清的話說,在Pokee的架構中,LLM主要是充當人機交互界面,類似「UI層」,用以理解用戶意圖,而真正決策、執(zhí)行任務的全都是基于RL結構完成。
但那是去年10月,OpenAI還沒有發(fā)布o1,將RL推向大眾,DeepSeek也還沒有引起全球狂歡。
在與大多數(shù)的投資人聊的時候,他們都覺得Pokee.ai這個方向是天方夜譚……如今,它已經慢慢從「非共識」變成了「共識」,而Pokee.ai也邁進新階段。
最新消息,Pokee.ai完成1200萬美元種子輪融資,由Point72Ventures領投,PokeeAI的公開測試版現(xiàn)已上線。
本周,在Pokee正式公測前,《機器之心》與朱哲清聊了聊,以下為對話內容:
機器之心:Pokee.ai去年10月成立,如今產品正式公測、完成種子輪融資,這樣的節(jié)奏在你預期內嗎?
朱哲清:整體節(jié)奏比較快,去年10月Pokee.AI成立,從概念驗證,到通用Agent框架搭建,再到如今產品公測和融資宣布,其實也才7個多月。之前定的目標是,今年上半年最重要的是做完產品第一輪公測、拿到種子輪融資,現(xiàn)在全部完成,總體來說符合預期。
與Meta相比,節(jié)奏大概會快4—5倍,對我來說生活和工作節(jié)奏沒有太大變化,甚至有更多時間去思考。我之前工作時同步在讀博士,那時候特別忙,一周可能要工作100多個小時,現(xiàn)在還是100多個小時,但思考的時間變多了。
機器之心:你做的事情其實很少有人做,你印象中投資人問的最多的問題是什么?
朱哲清:剛開始和投資人聊的時候,總體感受就是他們不理解為什么要用一個跟別人不一樣的方式去做Agent,那時候RL又不火、DeepSeek也沒出來。當我第一次跟投資人說我們最終想做的是讓一個RLSystem變成一個像通用操作系統(tǒng)一樣的東西時,他們都覺得這是天方夜譚。
機器之心:說到做AIAgent的初衷,你曾說Pokee.AI做的是「目標不是像人一樣完成任務,而是超過人類在某些任務中的策略選擇和規(guī)劃能力?!惯@是不是現(xiàn)在很火的ASI概念?
朱哲清:我覺得ASI與AGI的定義范疇其實很模糊,從某種意義上來說,我們可能已經實現(xiàn)了ASI,如果給你一個100萬Token的文章,人類要讀很久才能把它讀完,而模型只需要幾秒或幾十秒鐘就完成了,那從這個角度來說它已經SuperHumanIntelligence。
我們距離Agent「ChatGPT時刻」還有多遠?
機器之心:在你看來,一個通用Agent應該具備哪些特點?
朱哲清:一個通用Agent的核心能力在于,不管是在什么場景下,要解決什么問題,只要把prompt告訴它,它就可以把任務完成,而不需要事先去配置要用哪些工具。
我們的設想是,客戶給到一個prompt,說這是我要做的事情需求,這家公司或者開發(fā)者不需要處理,直接將prompt「扔」給Pokee,Pokee就根據prompt調用對應工具,把問題解決,將結果直接傳回給公司或開發(fā)者,之后后者可以把內容用更好的展現(xiàn)形式反饋會給客戶。
機器之心:可以理解為這是AIAgent的「ChatGPT時刻」嗎?現(xiàn)在處于什么階段?
朱哲清:是的,這是一個完完全全不需要人為配置的AIAgent,也是我們的最終設想?,F(xiàn)在的AIAgent需要的(工具)配置量很大,要匹配MCPServer、找工具,而在prompt下面可以加的工具很有限,也不能拼命加,那總體的訓練量就很大。
機器之心:所以當時創(chuàng)業(yè)是因為看到這些局限性,Pokee.ai是如何做的?
朱哲清:我們想做的就是如何能夠讓第三方開發(fā)者在幾乎不需要做任何開發(fā)的情況下完成AIAgent的搭建,不管是NoCode還是LowCode。NoCode是指Pokee直接跑一個prompt,得到工作流后,直接復制粘貼給無數(shù)個場景下面;LowCode,是指別人通過我們的接口把他們想要解決的問題以Prompt形式傳過來,從而把問題解決了,也不用告訴我們要用什么工具。
機器之心:以RL為核心的AIAgent和以LLM為核心的AIAgent的差異性在哪里?
朱哲清:首先,當下的很多LLM也用強化學習,而我們做的強化學習模型的工具調用范圍和常規(guī)LLM模型的工具調用范圍不一樣,具體來說是動作空間(ActionSpace)的區(qū)別,就是LLM模型的動作空間只有Token,而強化學習模型的動作空間可能不是Token,是那些工具,直接通過工具本身的泛化性來完成對于AIAgent的搭建。
機器之心:在你對通用Agent的描述中,對prompt的要求很高,但似乎并不是每個人都會提問題,如何看待這一現(xiàn)象?
朱哲清:是的,現(xiàn)在用戶在使用Pokee的時候也會遇到這個問題,已經把prompt給你了,可為什么你寫出來的東西不是我想要的?關鍵就在于,用戶給的prompt可能并不是他們的真正意圖,想做的和說的是兩回事。
該如何理解意圖就叫做對齊(Alignment),這件事情非常難,因為沒有一個GroundTruth,每個人說話方式都不一樣。如果真的想要找到GroundTruth,說用戶一定指的是這件事情,那必須要通過和這個人的長期Memory聯(lián)系起來才能夠找到。
如果我來評判這條路徑上該怎么走,就是先要能夠解決問題,之后把用戶的非訓練數(shù)據進行個性化(personalization),然后要去理解、對齊。大概就是三步走——決策能力、對于Memory的personalization、Alignment。
機器之心:能否舉例說一下?
朱哲清:比如之前投資人在試用我們產品時,寫了一個Prompt——能不能幫我draft一個LinkedInPost?那這個「draft」的意思到底是「單純幫我寫好但不要發(fā)出去」還是「幫我寫好并直接發(fā)出去」?
要想了解他的真正意圖就需要去看過往給他的員工或者同事說這句話的時候,他會怎么說,以及后者的回復,通過他們之間的交互來確認他說「draft」的意思。這是很復雜的一件事情,需要非常個性化的Memory才能完成。
機器之心:那當前處于哪一步?
朱哲清:整個行業(yè)第一步都還沒做完,更別說二、三步了(笑)。
機器之心:基于此,該怎么做?
朱哲清:我覺得這是一個很有意義也非常前瞻的問題,但從商業(yè)化角度來說,這不是第一優(yōu)先級,最先聚焦的應該是能不能解決問題?先把問題解決了,然后再往下探索能不能更好地理解(問題)。
機器之心:據了解,Pokee的架構是,將小型LLM作為人機交互界面,類似「UI層」,用于理解用戶意圖,而真正決策、執(zhí)行任務的全部基于強化學習結構來完成?;谶@一理解,其實你們對于prompt的要求很高?
朱哲清:對,這就復雜得多了,所以我一直說,LLM做得越好,我們就能做得越好。雖然我們是將RL而非LLM作為AIAgent核心,但我們與LLM并非競爭關系,如果純語言方向不能變得更好,我們也會有瓶頸,根本無法完全完整地理解用戶到底要說什么。
創(chuàng)業(yè),一個孤獨的漫長旅程
機器之心:從離開Meta開始創(chuàng)業(yè)到現(xiàn)在有大半年時間,你覺得工作和創(chuàng)業(yè)有什么區(qū)別,最大的感受是什么?
朱哲清:區(qū)別很大,期間也有過掙扎,但不是因為時間管理、勞累,而是創(chuàng)業(yè)本身是一條很模糊的路,或者說本來就沒有路,你想走成什么樣,它就是什么路。作為公司CEO,看似有很大的話語權,你說要往哪走就往哪走,但實際上能做的決策數(shù)量有限,要對公司、大家負責。
在大公司不一樣,可以做無數(shù)次決策,甚至可以換組,這個東西做不下去就換個方向。
機器之心:據了解,團隊從成立到今年4、5月份一直是四人核心配置,現(xiàn)在有多少人?有沒有考慮擴張?
朱哲清:目前團隊有7個人,接下來還會招兩三個人,但是大概率在收入規(guī)模擴大前不會將團隊配置超過10個人。
機器之心:所以也可以說AI時代的創(chuàng)業(yè)更為「輕量級」?
朱哲清:是的,AI時代,模型、產品打磨各方面其實用不了很多人,人多了,反而做事情會躡手躡腳。
機器之心:你們辦公室位于哪里?日常工作狀態(tài)是怎樣的?
朱哲清:我們沒有辦公室。
機器之心:那平時開會也是線上?
朱哲清:全部線上,因為有人在西雅圖,有人在灣區(qū),還有人在新加坡,都不在一起。另外我們都是Meta出身,習慣了遠程辦公,即便沒有辦公室,效率也挺高,而且還能兼顧生活。現(xiàn)在,我們每天線上開一個會,要做什么,大家一起討論決定。
宋朝風云錄,十大宋朝歷史小說,帶你走進大宋王朝的輝煌與陰謀
在失明的時期里,他大肆辱宋,還每天一個宋朝的地獄小笑話,將皇帝氣得暴跳如雷,還好他非常重要,而且本身也是趙宋后裔。不過他的歷史科普和小笑話還是引起了連鎖發(fā)音,晏殊、范仲淹還有在場各個派系的重臣罕見的與皇帝達成了堅不可摧的同盟,自上而下的改革開始,而且還有主角查缺補漏——。當主角重見光明,自然又是到此結束了?。
宋朝的書籍:推薦8本豆瓣高分歷史小說帶你夢回大宋
總結:質量中等偏上的南宋歷史架空小說,適合放松解壓與新手入門,感覺還是可以的,值得一看。第七本《天漢之國》作者:安化軍字數(shù):259萬狀態(tài):已完結簡介:當契丹被新興的女真人打得風雨飄搖,宋朝君臣喜出望外,派兵亂糟糟地去搶幽燕之地。一陣混亂之后,女真鐵騎乘勢南下,開封府就此陷落。在金軍縱橫中原,..
五本高分宋代歷史小說:主角如何扭轉宋朝頹勢
《寒門梟士》是一部質量中規(guī)中矩的北宋輔臣流歷史架空小說|-。小說對歷史有一定的考據內容,行文流暢,故事節(jié)奏分明。然而,小說也存在一些缺點,如主角過于全能、細節(jié)處理不夠精細等。但總體來說,這部小說還是值得一看的————。第三本《暗黑大宋》作者:午后方晴字數(shù):342.3萬簡介:《暗黑大宋》講述了主角王巨穿越好了吧!
來源:紅網
作者:齊靈松
編輯:苦代秋
本文為紅辣椒評論 原創(chuàng)文章,僅系作者個人觀點,不代表紅網立場。轉載請附原文出處鏈接和本聲明。