OpenAI正在推出一款名為ChatGPT的全新通用AI代理,該公司表示,它可以代表用戶完成各種基于計(jì)算機(jī)的任務(wù)。
OpenAI表示,該代理可以自動(dòng)瀏覽用戶的日歷,生成可編輯的演示文稿和幻燈片,并運(yùn)行代碼。
這款名為ChatGPT代理的工具融合了OpenAI之前代理工具的多項(xiàng)功能,包括Operator在網(wǎng)站上點(diǎn)擊的能力,以及DeepResearch將數(shù)十個(gè)網(wǎng)站的信息整合成一份簡(jiǎn)明研究報(bào)告的能力。
OpenAI表示,用戶只需使用自然語(yǔ)言輸入ChatGPT即可與該代理進(jìn)行交互。
ChatGPT代理將于周四向OpenAIPro、Plus和Team計(jì)劃的訂閱用戶推出。要激活該工具,用戶可以在ChatGPT的工具下拉菜單中選擇代理模式。
ChatGPT代理的推出代表了OpenAI迄今為止最大膽的嘗試,旨在將ChatGPT打造成一款能夠?yàn)橛脩舨扇⌒袆?dòng)和分擔(dān)任務(wù)的代理產(chǎn)品,而不僅僅是回答問(wèn)題。
近年來(lái),包括OpenAI、谷歌和Perplexity在內(nèi)的硅谷公司已經(jīng)推出了數(shù)十款承諾實(shí)現(xiàn)這一目標(biāo)的AI代理。然而,這些早期版本的AI代理已被證明難以處理復(fù)雜任務(wù),而且作為產(chǎn)品,它們似乎不如科技高管們所宣傳的AI代理的終極愿景那么引人注目。
話雖如此,OpenAI表示ChatGPT代理比其以前的產(chǎn)品功能強(qiáng)大得多。
該公司的新代理可以訪問(wèn)ChatGPT連接器,允許用戶連接Gmail和GitHub等應(yīng)用程序,以便代理能夠找到與你的提示相關(guān)的信息。OpenAI表示,ChatGPT代理可以訪問(wèn)終端,并且可以使用API訪問(wèn)某些應(yīng)用程序。
OpenAI建議用戶利用ChatGPT代理“規(guī)劃并購(gòu)買食材,制作四人份日式早餐”,以及“分析三個(gè)競(jìng)爭(zhēng)對(duì)手并制作幻燈片”。這些功能需要ChatGPT代理解析網(wǎng)站、規(guī)劃行動(dòng)方案并使用工具——這比OpenAI之前嘗試用代理解決的任務(wù)要復(fù)雜得多。
OpenAI表示,ChatGPT代理所基于的模型在多個(gè)基準(zhǔn)測(cè)試中提供了最先進(jìn)的性能。
該公司表示,ChatGPT代理模型在Humanity的LastExam(pass@1)考試中獲得了41.6%的分?jǐn)?shù)。這項(xiàng)考試難度極高,包含一百多個(gè)科目的數(shù)千道題目。這大約是OpenAI的o3和o4-mini在該測(cè)試中得分的兩倍。
OpenAI表示,在已知最難的數(shù)學(xué)基準(zhǔn)測(cè)試之一FrontierMath上,ChatGPT代理在能夠使用工具(例如用于代碼執(zhí)行的終端)的情況下,得分可達(dá)27.4%。此前的最高得分來(lái)自o4-mini,得分僅為6.3%。
OpenAI指出,其在開發(fā)ChatGPT代理時(shí)始終將安全性放在首位,主要是因?yàn)樵摦a(chǎn)品的一些新功能可能會(huì)使其在不法分子手中變得更加危險(xiǎn)。OpenAI此前曾警告稱,代理模型可能會(huì)帶來(lái)更危險(xiǎn)的功能。
OpenAI在ChatGPT代理的安全報(bào)告中表示,該模型在生物和化學(xué)武器領(lǐng)域被評(píng)定為高能力,OpenAI的防范框架將其定義為具有放大現(xiàn)有嚴(yán)重危害途徑能力的模型。
OpenAI指出,目前尚無(wú)直接證據(jù)證明這一點(diǎn),但已決定采取預(yù)防措施,并啟動(dòng)新的保障措施來(lái)降低這些風(fēng)險(xiǎn)。
ChatGPT代理的新安全措施包括一個(gè)在用戶與產(chǎn)品交互時(shí)實(shí)時(shí)運(yùn)行的監(jiān)視器。
OpenAI表示,它會(huì)對(duì)輸入ChatGPT代理的每個(gè)提示運(yùn)行一個(gè)分類器,以確定該請(qǐng)求是否與生物學(xué)相關(guān)。如果是,OpenAI會(huì)通過(guò)第二個(gè)監(jiān)視器運(yùn)行ChatGPT代理的響應(yīng),以確定該內(nèi)容是否可能被用來(lái)引發(fā)生物威脅。
OpenAI還表示,為了防止濫用,它已禁用ChatGPT代理的記憶功能。在ChatGPT的其他部分,OpenAI的記憶功能允許聊天機(jī)器人引用之前用戶聊天記錄中的信息。
然而,OpenAI表示,不法分子可能會(huì)利用ChatGPT代理中的該功能,通過(guò)快速注入攻擊竊取敏感數(shù)據(jù)。不過(guò),該公司表示,未來(lái)可能會(huì)重新考慮添加該功能。
ChatGPT代理聽起來(lái)令人印象深刻,但它在現(xiàn)實(shí)世界中的能力究竟如何還有待觀察。迄今為止,代理技術(shù)在與現(xiàn)實(shí)世界交互時(shí)已被證明相對(duì)脆弱。
即便如此,OpenAI表示,它已經(jīng)開發(fā)出一種功能更強(qiáng)大的模型,能夠兌現(xiàn)AI代理的承諾。