近日,《麻省理工科技評論》與OpenAI的兩位研究主管陳信翰(MarkChen)和雅各布·帕霍基(JakubPachocki)進行了獨家對話,探討了如何構(gòu)建更強大推理模型的路徑,以及“超級對齊”的未來。該文章在發(fā)布之后還得到了OpenAI首席執(zhí)行官山姆·奧特曼(SamAltman)在X上的轉(zhuǎn)發(fā)。
圖|從左到右:馬克·陳和雅各布·帕霍基(來源:OpenAI)
過去幾年,OpenAI給人的印象仿佛是一家“一個人的公司”。首席執(zhí)行官山姆·奧特曼(SamAltman)憑借明星般的風格和在融資中的高調(diào)表現(xiàn),讓公司其他重要人物都顯得黯然失色。即便曾被“趕下臺”,最終也強勢回歸,比以往更具聲望。但如果撇開這位光鮮的掌舵者,就能更清楚地看見公司真正的方向。畢竟,OpenAI聲名遠播的技術(shù),并非出自奧特曼本人之手。
這一責任落在了OpenAI的兩位研究主管——首席研究官馬克·陳(MarkChen)和首席科學家雅各布·帕霍基(JakubPachocki)肩上。他們共同負責確保OpenAI始終領(lǐng)先于谷歌等強勁對手。
最近,兩人前往英國倫敦——OpenAI于2023年在此設立了首個海外辦公室。《麻省理工科技評論》在那次行程中對他們進行了獨家專訪。我們聊到了如何平衡研究與產(chǎn)品之間的天然張力。他們還解釋了為什么認為編程和數(shù)學是通用模型變得更強的關(guān)鍵;他們談論的AGI究竟意味著什么;以及由聯(lián)合創(chuàng)始人、前首席科學家伊利亞·蘇茨克弗(IlyaSutskever)成立、旨在預防“超級智能失控”的超級對齊團隊,在他離職后為何迅速解散。
我尤其想了解,在OpenAI即將發(fā)布數(shù)月來最重要產(chǎn)品GPT-5之際,他們對這項工作的關(guān)注點在哪里。
有報道稱,該公司的下一代模型將于8月發(fā)布。OpenAI(或者說奧特曼)給出的官方說法是:GPT-5將會“很快”上線。人們對此期待已久。GPT-3和GPT-4的接連突破,顯著抬高了公眾對AI技術(shù)潛力的認知門檻。然而,GPT-5的推遲也引發(fā)了各種猜測——有人認為,OpenAI正面臨難題,無法打造出連自己都滿意的模型,更別說滿足外界期待了。
奧特曼一改往日風格,罕見地表現(xiàn)得頗為低調(diào)。他在X上發(fā)文稱:GPT-5是一個實驗性質(zhì)的模型,融合了我們將在未來模型中采用的新研究方法?!甭犉饋磉@更像是一個進行中的嘗試,而不是又一次顛覆式發(fā)布。
但對于一家近幾年一直引領(lǐng)行業(yè)走向的公司來說,管理好外界預期也是工作的一部分。而在OpenAI內(nèi)部,制定議程的人就是陳和帕霍基。
圖|奧特曼在X上轉(zhuǎn)發(fā)本次文章的英文版(來源:X)
雙峰
OpenAI在倫敦的主辦公室位于圣詹姆斯公園,距離白金漢宮不遠。但我是在國王十字附近的一間共享辦公室里見到陳和帕霍基的。這里是OpenAI在倫敦科技核心區(qū)的小型據(jù)點,附近還有谷歌DeepMind和Meta。OpenAI的研究傳播主管勞倫斯·??祪?nèi)特(LauranceFauconnet)坐在桌子盡頭,打開了筆記本電腦。
陳穿著酒紅色POLO衫,干凈利落,帶點精英預科生氣質(zhì)。他接受過媒體培訓,與記者交流毫不怯場。(他曾在GPT-4o發(fā)布視頻中與聊天機器人打情罵俏。)帕霍基穿著印有大象圖案的黑色T恤,氣質(zhì)更像電視劇里的黑客,說話時常盯著自己的手看。
不過兩人合作得比外表更緊密。
帕霍基說,陳主要負責組建和管理研究團隊?!岸覄t負責制定研究路線圖,設定我們長期的技術(shù)愿景?!?/p>
“但我們的角色是可以互換的?!标愓f,“我們都是研究員,都會深入技術(shù)細節(jié)。只要發(fā)現(xiàn)有技術(shù)可解的問題,我們都會主動解決?!?/p>
陳于2018年加入OpenAI,此前是華爾街JaneStreet的量化交易員,在那里他開發(fā)了期貨交易的機器學習模型。在OpenAI,他主導開發(fā)了生成式圖像模型DALL-E,后又參與GPT-4圖像識別功能的實現(xiàn),并帶領(lǐng)團隊打造了代碼生成模型Codex(GitHubCopilot的核心)。
帕霍基2017年從理論計算機科學研究領(lǐng)域轉(zhuǎn)向工業(yè)界,加入OpenAI,并在2024年接替蘇茨克弗出任首席科學家。他是OpenAI推理模型(如o1和o3)的主要架構(gòu)師,這些模型專為攻克數(shù)學、科學、編程等復雜任務而設計。
我們見面時,兩人正為OpenAI技術(shù)的連續(xù)勝利而興奮不已。
7月16日,OpenAI的大語言模型在AtCoder世界總決賽中奪得第二名,這是世界最難的編程競賽之一。7月19日,OpenAI又宣布其模型在2025年國際數(shù)學奧林匹克競賽(IMO)中取得金牌水平成績。
這一數(shù)學結(jié)果之所以登上頭條新聞,不僅是因為OpenAI取得了非凡成就,還因為兩天后其競爭對手谷歌DeepMind透露,其一款模型取得了相同的成績。谷歌DeepMind遵守了比賽規(guī)則,在等待主辦方核實結(jié)果后才宣布了這一消息;而OpenAI則是自行評分。
對于陳和帕霍基來說,結(jié)果本身就說明了一切。無論如何,他們最興奮的是編程競賽的勝利?!拔艺J為這被低估了?!标惛嬖V我。他說,在國際數(shù)學奧林匹克競賽中獲得金牌意味著你躋身前20至50名參賽者之列。但在AtCoder競賽中,OpenAI的模型排在前兩名:“真正躋身人類表現(xiàn)的全新層級——這是前所未有的?!?/p>
一切以發(fā)布為核心!
OpenAI員工仍然喜歡稱自己是在研究實驗室工作,但自三年前ChatGPT發(fā)布以來,這家公司早已不可同日而語。它如今估值達3000億美元,正與全球最強的科技巨頭競爭。光有突破性的研究和炫技演示已經(jīng)遠遠不夠——它必須推出產(chǎn)品,并讓產(chǎn)品真正落地——而它確實做到了。
OpenAI持續(xù)推出新產(chǎn)品——對其GPT-4系列進行了重大更新,發(fā)布了一系列生成式圖像和視頻模型,并引入了用語音與ChatGPT對話的功能。六個月前,它推出了名為o1的新一代推理模型,隨后又推出了o3。它還推出了瀏覽器智能體Operator。目前,其產(chǎn)品每周活躍用戶超4億,每天收到25億條指令。
OpenAI即將上任的應用程序首席執(zhí)行官菲吉·西莫(FidjiSimo)希望保持這一勢頭。在給公司的一份備忘錄中,她告訴員工,她期待“幫助OpenAI的技術(shù)被全球更多人掌握”,這些技術(shù)將“為更多人帶來前所未有的機會”。預計產(chǎn)品會源源不斷地推出。
我問OpenAI是如何平衡開放式研究和產(chǎn)品開發(fā)的。“這是我們在ChatGPT出現(xiàn)之前就一直思考的問題。”帕霍基說?!叭粑覀冋J真對待通用人工智能目標,那在這個過程中,很多研究支線其實本身就會變成偉大的產(chǎn)品?!睋Q言之,就是不斷搖動樹干,總會掉下果子。
OpenAI員工經(jīng)常提到的一個觀點是,將實驗性模型推向市場,本身就是研究的一部分。其目的是讓人們意識到這項技術(shù)已經(jīng)變得多么出色?!拔覀兿敫嬖V人們即將發(fā)生什么,這樣我們才能參與到一場非常艱難的社會對話中。”奧特曼(Altman)在2022年告訴我。這項奇怪新技術(shù)的創(chuàng)造者也很好奇它可能用于什么:OpenAI熱衷于將其交到人們手中,看看他們會用它來做什么。
現(xiàn)在還是這樣嗎?他們幾乎同時回答:“是的!”陳說?!霸谀撤N程度上吧?!迸粱艋f。
陳笑著示意帕霍基繼續(xù)。帕霍基說:“我不會說研究就是產(chǎn)品迭代。但如今模型在傳統(tǒng)基準測試上已接近上限,我們長期以來關(guān)注的問題也開始出現(xiàn)突破。我們現(xiàn)在真正想看的是,這些模型在現(xiàn)實世界中能做些什么。”
就像在編程競賽中與人類一較高下一樣。在今年于日本舉行的AtCoder競賽中,擊敗OpenAI模型的是一位名叫Przemys?awD?biak的程序員,他也被人們稱為Psyho。這場競賽是一場解謎馬拉松,參賽者有10個小時的時間來尋找解決復雜編程問題的最有效方法。獲勝后,Psyho在X上發(fā)帖稱:“我完全筋疲力盡了……我快崩潰了?!?/p>
陳和帕霍基與競技編程界有著密切的聯(lián)系。兩人都曾參加過國際編程競賽,陳還執(zhí)教美國計算機奧林匹克競賽隊。我問他們,他們對編程比賽的熱情是否讓他們過于看重模型在這類挑戰(zhàn)中的表現(xiàn)。
他們都笑了?!按_實如此?!迸粱艋f,“Psyho算是個傳奇人物,多年來一直是頭號選手。他也是我朋友——我們以前常一起參賽?!彼€曾在OpenAI工作過。
當帕霍基參加編程競賽時,他更青睞那些專注于較短且具有具體解決方案的問題。但Psyho則喜歡那些更長、沒有明確正確答案的開放式問題。
“他過去總是取笑我,說我喜歡的那種比賽在他喜歡的那些比賽之前很久就會被自動化?!迸粱艋貞浀?,“所以我在這次最新的比賽中對這個模型的表現(xiàn)寄予了厚望?!?/p>
帕霍基告訴我,他一直守在東京的深夜直播中,看著他的模型獲得第二名:“Psyho目前還在抵抗?!?/p>
“我們追蹤大模型在編程競賽中的表現(xiàn)已經(jīng)有一段時間了?!标愓f道,“我們見證了它們的表現(xiàn)超越了我,超越了帕霍基。這就像李世石和AlphaGo的故事?!?/p>
李世石是圍棋大師,2016年,他在一系列比賽中輸給了DeepMind的游戲模型AlphaGo。這一結(jié)果震驚了國際圍棋界,并導致李世石放棄了職業(yè)比賽。去年,他告訴《紐約時報》:“從某種意義上說,輸給人工智能意味著我的整個世界正在崩潰……我再也無法享受比賽了?!比欢?,與李世石不同,陳和帕霍基對被超越感到興奮。
但我們普通人為什么要關(guān)心這些小眾領(lǐng)域的勝利呢?很明顯,這項旨在模仿并最終取代人類智能的技術(shù),是由那些認為頂尖智能就是數(shù)學競賽中的高分或能與傳奇程序員一較高下的人所開發(fā)的。這種偏重數(shù)學和分析能力的智能觀是否過于狹隘?
“你說得沒錯——我們確實有點私心地想造出能提升我們效率的模型?!标愓f?!拔覀冋J為這是取得進步的一個非常迅速的因素?!?/p>
像陳和帕霍基這樣的研究人員提出的論點是,數(shù)學和編程是更為普遍的智能形式的基石,這種智能能夠以我們自己可能都沒有想到的方式解決各種各樣的問題?!拔覀冊谶@里談論的是編程和數(shù)學?!迸粱艋f,“但它實際上是關(guān)于創(chuàng)造力,關(guān)于提出新穎的想法,關(guān)于將來自不同領(lǐng)域的想法聯(lián)系起來?!?/p>
看看最近的兩場比賽:“在這兩場比賽中,都出現(xiàn)了需要非常艱難、打破常規(guī)思維的問題。Psyho在編程比賽的一半時間里都在思考,然后想出了一個非常新穎且與我們模型所見的任何解決方案都截然不同的解決方案。”
“這確實是我們所追求的?!迸粱艋^續(xù)說道,“我們?nèi)绾巫屇P桶l(fā)現(xiàn)這種新穎的見解?如何真正增進我們的知識?我認為它們已經(jīng)在某些有限方面具備了這種能力。但我認為這項技術(shù)有潛力真正加速科學進步。”
我回到了關(guān)于對數(shù)學和編程的關(guān)注是否成問題的問題上,承認如果我們正在構(gòu)建的是幫助我們進行科學的工具,那么這或許也沒什么問題。我提出,我們并不一定希望大型語言模型取代政治家,也不希望它們具備人際交往能力。
陳做了個鬼臉,抬頭望向天花板:“有何不可?”
還缺什么?
OpenAI的誕生帶有一種即便以硅谷標準也算傲慢的雄心。在AGI還被視為異想天開的年代,它就大張旗鼓地宣布要實現(xiàn)AGI。如今,OpenAI對AGI的執(zhí)著依舊,并且比多數(shù)公司都更努力地將AGI推進為主流、甚至千億美元級的技術(shù)方向。但它仍未抵達終點。我問陳和帕霍基,他們認為通向AGI還缺了什么。
“我覺得,想象未來最好的方式,是深入研究我們今天已經(jīng)看到的技術(shù)?!迸粱艋f。“OpenAI從一開始就把深度學習看作神秘但極具潛力的強大工具。我們一直在試圖理解它的瓶頸:它能做什么?不能做什么?”
陳說,目前最前沿的是推理模型,它們能把大問題拆解成更小、可管理的步驟。但即便如此,模型仍有局限性:“你會發(fā)現(xiàn),有些模型知道很多知識,但無法把這些知識串聯(lián)起來。為什么會這樣?它們?yōu)槭裁床荒芟袢祟惸菢油评???/p>
OpenAI正全力以赴想弄清楚這個問題。
“我們可能還處于這種推理范式的初級階段?!迸粱艋嬖V我,“實際上,我們正在思考如何讓這些模型長期學習和探索,并真正產(chǎn)生全新的想法。”
陳進一步強調(diào):“我不認為我們已經(jīng)攻克了推理??隙ㄟ€沒做到。你得讓模型讀足夠多的文本,才能大致模擬出人類的知識水平?!?/p>
OpenAI不愿透露其用來訓練模型的數(shù)據(jù),也不愿詳細說明這些數(shù)據(jù)的規(guī)模和結(jié)構(gòu)——只是表示他們正在努力提高開發(fā)流程各階段的效率。
這些努力讓他們相信,所謂的“擴展定律”(即模型會隨著計算能力的提升而不斷優(yōu)化)并未顯示出失效的跡象。
“我沒看到任何跡象表明擴展定律失效了?!标悎苑Q?!捌款i當然存在。有時是模型架構(gòu)問題,有時是數(shù)據(jù)問題。但歸根結(jié)底,就是找到能突破當前瓶頸的研究路徑?!?/p>
對進步的信念是堅定不移的。我提到了帕霍基在5月份接受《自然》雜志采訪時談到的關(guān)于AGI的事情:“2017年我加入OpenAI時,我仍是公司里最大的懷疑論者之一?!彼犕旰箫@得有些遲疑。
“我不確定自己是否曾對這個概念持懷疑態(tài)度?!彼f,“但我想我確實懷疑過——”他頓了頓,看著自己放在面前桌子上的雙手?!爱斘壹尤隣penAI時,我原以為,要達到我們現(xiàn)在的階段,至少還得花更長時間?!?/p>
“AI的影響有很多,”他說,“但我最關(guān)注的是自動化研究。當我們回顧人類歷史,會發(fā)現(xiàn)其中很多都與科技進步、人類創(chuàng)造新技術(shù)有關(guān)。計算機能夠自行開發(fā)新技術(shù),這一時刻似乎是一個非常重要的轉(zhuǎn)折點。”
“我們已經(jīng)看到這些模型在輔助科學家工作。但當它們能夠著眼于更長遠的未來——當它們能夠為自己建立研究項目時——世界將會發(fā)生有意義的改變?!?/p>
對于陳而言,模型能夠自主工作更長時間的能力是關(guān)鍵?!拔业囊馑际?,我確實認為每個人對AGI都有自己的定義?!彼f?!暗灾鲿r間’這個概念很重要——即模型可以在不陷入死胡同的前提下,持續(xù)解決一個困難問題的時間。這就是我們努力的方向之一?!?/p>
這是一個大膽的愿景——遠遠超出了當今模型的能力范圍。但陳和帕霍基讓AGI聽起來幾乎平淡無奇,這還是讓我感到震驚。這與我18個月前與蘇茨克維爾交談時他的回應形成了鮮明對比?!斑@將具有里程碑意義,驚天動地。“他告訴我。它會把歷史劃分為‘之前’和‘之后’?!彼麑GI的信念如此深刻,以至于放棄繼續(xù)研發(fā)最強模型,轉(zhuǎn)而投身研究“如何控制這項可能比他更聰明的技術(shù)”。
兩年前,蘇茨克維爾組建了一支他稱之為“超級對齊”的團隊,他將與另一位OpenAI安全研究員簡·萊克(JanLeike)共同領(lǐng)導該團隊。據(jù)稱,該團隊將把OpenAI五分之一的資源投入到研究如何控制一種假設的超級智能中。如今,包括蘇茨克維爾和萊克在內(nèi)的超級對齊團隊的大多數(shù)成員已經(jīng)離開公司,該團隊也不復存在。
萊克辭職時表示,這是因為團隊沒有得到他認為應得的支持。他在X上發(fā)帖稱:“打造比人類更智能的機器是一項本質(zhì)上危險的任務。OpenAI肩負著全人類的巨大責任。但在過去幾年里,安全文化和流程讓位于光鮮亮麗的產(chǎn)品?!逼渌x職的研究人員也發(fā)表了類似聲明。
我問陳和帕霍基他們對這些擔憂有何看法。“很多事情都是高度個人化的決定?!标愓f?!澳阒?,研究人員有時會……”
他停頓了一下,重新組織語言:“他們可能堅信這個領(lǐng)域會以某種方式發(fā)展,他們的研究會取得成功并結(jié)出果實。而且,你知道,也許公司并沒有按照你想要的方式重塑。這是個高度動態(tài)的領(lǐng)域?!?/p>
“很多事情都是個人決定?!彼貜偷?,“有時候,這個領(lǐng)域的發(fā)展與你做研究的方式并不那么一致?!?/p>
但兩人都堅稱,對齊工作如今已成為核心業(yè)務的一部分,而不再是一個特定團隊所關(guān)注的問題。帕霍基表示,除非這些模型能如你所愿地工作,否則它們根本不起作用。而讓現(xiàn)有模型行為符合預期,已經(jīng)夠難了——沒人還有精力去思考假想中的超級智能該如何對齊。
“兩年前,我們想象中的風險大多為理論風險?!迸粱艋f,“但現(xiàn)在世界已經(jīng)不同,很多對齊問題已變得非常實際、具體。”
盡管如此,實驗技術(shù)正以前所未有的速度被轉(zhuǎn)化為大眾市場產(chǎn)品。這真的不會導致兩者之間產(chǎn)生分歧嗎?
“我常常有幸能真正從長遠角度思考技術(shù)未來的發(fā)展方向。”帕霍基說,“而應對流程中的現(xiàn)實問題——無論是人員方面,還是更廣泛的公司需求方面——則落在馬克身上。這并非真正的分歧,但這些不同的目標與公司所面臨的不同挑戰(zhàn)之間,自然而然會產(chǎn)生緊張關(guān)系,而這種關(guān)系在我們之間也體現(xiàn)了出來?!?/p>
陳插話說:“我認為這是一種非常微妙的平衡。”
附MarkChen和雅各布·帕霍基(JakubPachocki)的個人介紹:
MarkChen(陳信翰)是OpenAI的核心技術(shù)領(lǐng)導者之一,現(xiàn)任首席研究官(ChiefResearchOfficer),負責統(tǒng)籌OpenAI的前沿AI研究,并推動科研成果向產(chǎn)品轉(zhuǎn)化。他出生于中國臺灣,成長于美國,高中時期隨家人返臺,曾就讀于新竹實驗中學雙語部,并在麻省理工學院獲得數(shù)學與計算機科學雙學位。MarkChen在OpenAI的貢獻極為突出,曾主導開發(fā)了多個關(guān)鍵AI模型,包括:DALL·E系列:OpenAI的突破性圖像生成模型。Codex:為GitHubCopilot提供支持的AI編程系統(tǒng)。GPT-4視覺功能:為GPT-4引入圖像識別能力。GPT-5研發(fā):目前正與首席科學家JakubPachocki共同領(lǐng)導OpenAI下一代大模型的開發(fā)。2024年,他升任研究高級副總裁(SVPofResearch),并在OpenAI高層重組后進一步晉升為首席研究官。他以其深厚的技術(shù)背景和領(lǐng)導力,推動OpenAI在AI競賽(如國際數(shù)學奧林匹克、AtCoder編程比賽)中取得突破性成績。此外,他曾在清華大學發(fā)表演講,分享ChatGPT的研發(fā)歷程,展現(xiàn)其技術(shù)影響力。MarkChen不僅是OpenAI的技術(shù)骨干,也是AI安全與推理能力發(fā)展的關(guān)鍵推動者,強調(diào)AI的穩(wěn)健性和社會價值。
JakubPachocki是OpenAI的首席科學家,自2017年加入公司以來,一直是推動AI前沿技術(shù)發(fā)展的核心人物。他于2024年接替IlyaSutskever成為OpenAI的首席科學家,領(lǐng)導了多個關(guān)鍵AI模型的研發(fā),包括GPT-4、OpenAIFive(Dota2AI玩家)以及o系列推理模型(如o1、o3)。Pachocki在AI領(lǐng)域的貢獻不僅限于語言模型,他還專注于強化學習(RL)和世界模型(WorldModel)的研究,認為AI未來將能自主發(fā)現(xiàn)科學知識,而不僅僅是輔助工具。他強調(diào),AI推理能力的提升依賴于預訓練與強化學習的結(jié)合,使模型能夠“自主思考”而非僅依賴人類引導。在AGI的探索上,Pachocki認為AI的經(jīng)濟價值將是關(guān)鍵里程碑,預計未來五年AI將能自主進行科學研究,甚至今年就可能實現(xiàn)近乎自主的軟件開發(fā)。此外,他還帶領(lǐng)OpenAI的AI系統(tǒng)在國際數(shù)學奧林匹克競賽(IMO)和AtCoder編程比賽中取得頂尖成績,證明AI已具備高級推理能力。Pachocki低調(diào)務實,曾是谷歌CodeJam冠軍和ACMICPC金牌得主,擁有深厚的計算機科學背景。他的研究正在推動AI從工具向自主科研伙伴的轉(zhuǎn)變。
參考資料:
https://www.technologyreview.com/2025/07/31/1120885/the-two-people-shaping-the-future-of-openais-research/
運營/排版:何晨龍
金陵食坊:南京老味道與現(xiàn)代餐飲的碰撞
「國家名廚」梁發(fā)云 中國烹飪大師 中國淮揚菜大師
用“國風夜宴”打造沉浸體驗,梅見透露餐+酒“真經(jīng)”!