科技媒體techcrunch近日報道了一篇引人注目的博客文章,作者是三周前剛從openai離職的工程師calvinfrench-owen。這位曾參與開發(fā)openai最具前景新產品之一的工程師,在公司工作一年后選擇離開,并公開分享了他在這家ai巨頭內部的真實工作體驗。
french-owen曾是客戶數(shù)據(jù)初創(chuàng)公司segment的聯(lián)合創(chuàng)始人,該公司在2020年被twilio以32億美元收購。三周前,這位參與開發(fā)openai最具前景新產品之一的工程師選擇從公司離職,隨后在個人博客上分享了他在openai工作一年的深度觀察。
他強調自己離開openai并非因為任何"戲劇性事件",而是希望重新回到創(chuàng)業(yè)者的角色。他在博客中坦言,選擇離開是為了追求自己的創(chuàng)業(yè)夢想,而非對公司文化的不滿。
這篇博客文章揭露了許多openai內部運作的細節(jié),從瘋狂的產品開發(fā)節(jié)奏到公司文化的獨特之處。french-owen特別詳細描述了團隊如何在七周內從零開始構建并發(fā)布代碼助手codex的經歷,這款產品直接與cursor和anthropic的claudecode等工具競爭
他的觀察既證實了外界對openai的一些認知,也糾正了不少誤解。從公司的快速擴張到內部管理挑戰(zhàn),從產品發(fā)布的魔力時刻到外界監(jiān)督的壓力,french-owen的分享為外界提供了難得的內部視角。
瘋狂擴張:從千人到三千人的蛻變
openai的增長速度可以用"瘋狂"來形容。french-owen透露,在他工作的一年時間里,"openai從1000人增長到了3000人"。這樣的擴張速度在科技行業(yè)也屬罕見。
這種快速擴張并非沒有原因。chatgpt被公認為史上增長最快的消費產品,今年3月公司宣布其月活躍用戶已超過5億,并且還在快速攀升。面對激烈的市場競爭,各大ai公司都在加速招聘優(yōu)秀人才,openai自然不能落后。
然而,如此快速的人員增長也帶來了顯而易見的挑戰(zhàn)。正如french-owen所觀察到的,當公司規(guī)模迅速擴大時,原有的管理體系往往跟不上節(jié)奏,各種問題開始暴露出來。
成長的煩惱:混亂中尋找秩序
快速擴張的代價很快顯現(xiàn)出來。french-owen直言不諱地指出:
"當你擴張得如此之快時,一切都會出問題:公司內部如何溝通、匯報結構、如何發(fā)布產品、如何管理和組織人員、招聘流程等等。"
在這種環(huán)境下,openai仍然保持著小型初創(chuàng)公司的文化特色——員工可以相對自由地實施自己的想法,幾乎沒有繁文縟節(jié)的束縛。但這種自由也帶來了負面效應,多個團隊經常在做重復性工作。french-owen舉例說:"我見過至少六個用于隊列管理或代理循環(huán)的代碼庫。"
技術層面的挑戰(zhàn)同樣明顯。公司內部的編程水平參差不齊,既有來自谷歌的資深工程師,他們能編寫支持十億用戶的代碼,也有剛畢業(yè)的博士生,缺乏實際編程經驗。再加上python語言的靈活性,導致公司的核心代碼庫"有點像個垃圾場"。french-owen坦承,系統(tǒng)經常出現(xiàn)故障或運行緩慢,不過高級工程管理層已經意識到這些問題,正在積極尋求改進方案。
創(chuàng)業(yè)精神:七周打造codex的奇跡
盡管面臨各種挑戰(zhàn),openai仍然保持著濃厚的創(chuàng)業(yè)氛圍。french-owen觀察到,這家公司"似乎還沒有意識到自己已經是一家巨型公司",從完全依賴slack進行溝通就能看出這一點。他將公司的文化比作早期facebook時代的meta,充滿了"快速行動,打破常規(guī)"的精神。
這種創(chuàng)業(yè)精神的最佳體現(xiàn),就是codex項目的開發(fā)過程。這款與cursor和anthropic'sclaudecode競爭的編碼工具,竟然只用了七周時間就從構思走向發(fā)布。
french-owen回憶說,他的高級團隊包括大約8名工程師、4名研究人員、2名設計師、2名市場推廣人員和1名產品經理,整個團隊幾乎沒怎么睡覺就完成了這個項目。
產品上線后的表現(xiàn)更是令人驚喜。french-owen感慨道:
"我從未見過一個產品僅僅因為出現(xiàn)在左側邊欄就能獲得如此多的用戶,但這就是chatgpt的力量。"
這種即時的用戶增長,讓團隊的辛苦付出得到了最好的回報。
透明與保密的矛盾:在聚光燈下工作
作為全球最受關注的ai公司,openai處在一個相當特殊的位置。一方面,公司高度重視保密工作,試圖控制信息泄露;另一方面,外界對公司的一舉一動都極為關注。
french-owen描述了這種"玻璃屋"效應:"chatgpt是一家備受審視的公司。這導致了一種保密文化,試圖控制向公眾的信息泄露。"
同時,公司也密切關注社交媒體上的動態(tài),特別是x平臺。如果某個帖子在那里走紅,openai會看到并可能做出回應。正如french-owen引用朋友的話:"這家公司靠twitter情緒運營。"
這種對社交媒體動態(tài)的高度關注,反映了公司對公眾輿論的重視程度。這種外界壓力不僅來自普通用戶和媒體,還包括政府和競爭對手的密切關注。
各國政府都在監(jiān)督openai的發(fā)展,競爭對手也在密切觀察其動向,而openai同樣在觀察競爭對手。french-owen總結道:"感覺風險真的很高。"
這種矛盾的狀態(tài)反映了openai面臨的獨特挑戰(zhàn)——既要保持技術領先地位,又要應對公眾監(jiān)督;既要快速創(chuàng)新,又要承擔相應的社會責任。
在這樣的環(huán)境下工作,員工們不僅要面對技術挑戰(zhàn),還要適應高度透明的工作環(huán)境。
安全爭議:理論與實踐的平衡
外界對openai最大的爭議之一就是其在ai安全方面的態(tài)度。許多ai安全專家,包括一些前openai員工,都批評過公司的安全流程。對此,french-owen提供了內部視角的澄清。
他指出,外界對openai"不夠重視安全"的看法是最大的誤解。雖然確實有"末日論者"在擔心理論上的人類風險,但公司內部更多關注的是實際安全問題,"比如仇恨言論、濫用、操縱政治偏見、制造生物武器、自我傷害、提示注入"等具體威脅。
french-owen強調,openai并沒有忽視長期潛在影響。公司有研究人員專門研究這些問題,并且清楚地意識到數(shù)億人正在使用其大語言模型尋求從醫(yī)療建議到心理治療的各種幫助。
未來展望:在變革中尋找方向
從french-owen的描述來看,openai正處在一個關鍵轉折點。公司需要在保持創(chuàng)新速度和初創(chuàng)精神的同時,解決快速擴張帶來的管理和技術債務問題。如何在數(shù)千名員工的規(guī)模下仍能保持高效決策和產品迭代,將是公司面臨的核心挑戰(zhàn)。
技術層面的改進已經在進行中。french-owen提到,頂級工程管理層已經意識到代碼質量和系統(tǒng)穩(wěn)定性問題,正在著手改善。但這種改進需要時間,也需要在不影響創(chuàng)新速度的前提下進行。
以下為ai翻譯的前openai工程師calvinfrench-owen博客全文:
關于在openai工作的思考
我在三周前離開了openai。我是在2024年5月加入這家公司的。
我想分享我的思考,因為大家對openai做了很多猜測,但很少有人有在那里的第一手文化體驗。
nabeelquereshi有一篇很棒的文章,叫《對palantir的反思》,他回顧了是什么讓palantir如此特別。我也想做同樣的事,趁記憶還新,為openai留個注記。這里沒有任何商業(yè)機密,只是對當下這家最具吸引力的組織之一,在極具意義時刻,工作體驗的個人觀察。
首先要說的是:我離職并非因任何人事糾紛,恰好我對離開感到深深矛盾。從創(chuàng)立自己的組織,變成一家有三千名員工公司的職員,這種身份的轉換很難。現(xiàn)在我渴望一次全新的開始。
我也許會被那里的工作所吸引,回去也說不定。畢竟想象一下有機會參與agi的建設是不現(xiàn)實的,而大語言模型無疑是近十年以來的技術創(chuàng)新。我很慶幸能親眼見證一些發(fā)展,同時也參與了codex的發(fā)布。
顯然,這些并非公司的官方立場——只是我個人的觀察。openai是一個大機構,我只能從我的“小窗口”提供這些見聞。
首先要知道的是,openai擴展得極快。我加入時,公司剛剛超過1000人。但一年后已經超過3000人,而我在員工任職時間排名位列前30%。幾乎所有領導層在2–3年前都還不是在做現(xiàn)在這份工作。
顯然,快速擴張會帶來問題:如何在公司層面溝通,組織架構如何設定,如何推進產品發(fā)布,如何管理和組織人力,以及如何招聘等。不同團隊的文化情況也差別巨大:有些團隊持續(xù)高壓快跑,有些在監(jiān)控已有項目,有些保持更穩(wěn)定的節(jié)奏。沒有所謂的“openai體驗”,研究團隊、應用團隊、gtm(市場/銷售)節(jié)奏都完全不同。
openai有個特殊之處——一切都通過slack(一個用于工作溝通交流的平臺)運行,沒有電子郵件。我整個任期或許只收到過10封郵件左右。如果你不善于整理,很容易被這些渠道淹沒,但如果你管理好渠道和通知,也能做得井然有序。
openai鼓勵“自下而上”,尤其在研究領域尤為明顯。我剛加入時,問第一季度的路線圖在哪,得到的回答是:“不存在?!保ú贿^現(xiàn)在已經有了。)好主意可能來源任何人,通常我們并不清楚哪些想法會提前證明是最有成效的;公司不靠宏大的“總體計劃”,進展往往迭代并在新的研究結果基礎上逐步展開。
這種自下而上的文化也讓openai極具“重績效主義(meritocratic)”性質。歷史上,公司里的領導者大多是因擁有好點子并能執(zhí)行而晉升。許多非常優(yōu)秀的人,不擅長全體大會發(fā)言或政治運作,但在openai他們一樣能脫穎而出。好點子通常可以勝出。
openai的文化喜歡快速行動(biastoaction)。在類似方向有多個團隊同時試點并不少見。我剛加入時曾同時見到大概3–4種codex相關原型,最后才決定上線。它們通常由少數(shù)人自發(fā)發(fā)起,不需要特別審批;當看到希望時,團隊就自發(fā)聚攏。
codex負責人andrey曾說,你應該將研究員視為“迷你董事會”。在那里,你可以全盤推進自己的方向,看它能走多遠。相應地,如果某個問題被認為“無意思”或者“已解決”,它可能根本不會有人去關注。
優(yōu)秀的研究經理作用極大,但也都有限。他們擅長將不同方向的研究串聯(lián)起來,將其匯聚到大規(guī)模模型訓練里。同樣,出色的產品經理也能串起價值點,將力量聚合。
我合作過的chatgpt的工程經理(em)akshay、rizzo、sulman,是我見過最cool的“客戶”。他們經驗非常豐富。他們多為管理型角色,主要職責是招聘優(yōu)秀人才并為他們提供成功支持。
openai會瞬間調整方向。這點我們在segment(原公司)也很喜歡——有新情況就改變方向,比為了“計劃”一直推進要好得多。令人驚奇的是,openai這么大的公司還保留著這種思維方式——google顯然不是這樣。公司決策快速,一旦決定了努力的方向,就全力奔跑。
媒體上對openai有很多抨擊。我來自b2b企業(yè)背景,對此很震驚:內部還未宣布的功能,新聞稿已經播出;我告訴別人我在openai工作,往往就聽到對它的既有偏見。有一些twitter賬號用自動化機器人監(jiān)測功能上線情況。
因此,openai非常保密。我無法詳細告訴任何人我在做什么。公司內部有不同的工作空間和不同權限。營收、燒錢數(shù)據(jù)都高度保密。
openai也比你想象中更“嚴肅”,因為風險非常高。一方面要構建agi,需要把一切都做對;另一方面產品已有數(shù)以億計用戶在用于醫(yī)療建議、心理療愈等敏感場景;再者,openai處在與meta、google、anthropic的激烈競爭中,甚至全球政府都密切關注這個領域。
盡管媒體有抨擊,但我見的每個人都是真心“想把事情做好”。作為一家消費者導向的公司,曝光最大,也最易成為輿論焦點。
當然,不應把openai視作一個整體統(tǒng)一的“單一實體”。我更像把它當成“洛斯阿拉莫斯”式的組織——一群科學家在探索最前沿。巧合的是,他們也造出了歷史上最火爆的消費者app。之后開始擴展到政府和企業(yè)服務。公司里人來的時間不同、所處團隊不同,目標也不同——想法迥異。時間越久的人,越會帶著“研究實驗室”或“公益非營利”視角去看。
我最欣賞的一點是公司“說到做到”地讓ai利益大眾化。最先進的模型沒有鎖定在某個企業(yè)合同中。世界上任何人都可以訪問chatgpt,哪怕未登錄??梢宰詀pi使用——大多數(shù)模型(即使是sota或專有模型)會迅速加入api服務,讓創(chuàng)業(yè)公司、開發(fā)者都用得上。你可以猜測會有截然不同的企業(yè)版本策略,但openai并沒有走那條路,值得贊賞,這一點仍是公司文化核心。
安全問題的關注比你在zvi或lesswrong(社區(qū)論壇,專注于討論認知偏見等)里看到的還要多。公司有大量人手致力開發(fā)安全系統(tǒng)。但現(xiàn)實中更關注的是實用風險——仇恨言論濫用、政治操縱、研發(fā)生物武器、自我傷害誘導、及時藥物注入等——遠比理論上爆炸性風險更受關注。當然仍有人研究理論風險,那也是存在的。但在我看來,實用安全才是主流,很多安全內容不公開發(fā)表,openai其實還應該更多公開這一部分成果。
與很多公司在招聘會發(fā)大量周邊不同,openai不大送周邊(新員工也基本沒桌牌之類)。取而代之的是會不定期發(fā)“drops”,員工可以訂購庫存。第一次drop店鋪就被刷爆了,連shopify都掛了。有一個內部的帖子流傳如何post正確的json(基于javascript語言的輕量級的數(shù)據(jù)交換格式,即javascriptobjectnotation)有效負載和規(guī)避這一點。
所有事情與gpu成本相比都太小。舉例:codex中一個細小功能的gpu資源消耗,就相當于我們整個segment基礎設施的費用(雖然chatgpt規(guī)模更大,但平臺體量也大)。
openai是我見過的最雄心勃勃的組織。你大概會以為擁有一個全球頭部app就夠了,但他們志在多場戰(zhàn)役:api產品、深度研究、硬件、編程代理、圖像生成等等(還有很多未公開項目)。這里是個讓點子落地彈射的平臺。
公司非常關注twitter上的氛圍。如果你發(fā)的一條與openai相關的tweet爆火,很可能有人會看到并重視。一位朋友曾說:“這家公司靠twitter情緒運行?!睂τ谝粋€消費級公司來說,這點也沒毛病。當然他們也有用戶增長、留存等分析,但情緒倒也很重要。
openai里的團隊比很多地方更fluid、更靈活。在codex發(fā)布時,我們需要幾個chatgpt的工程師來趕進度。于是我們找chatgpt的產品經理提需求,第二天就來了兩位牛人,不需要等季度計劃或重新分配資源。動作快得驚人。
高層領導很活躍,好像沒一位是“掛名”——gdb(gregbrockman)、sama(samaltman)、kw(wojciechzaremba)、mark、dane等經常在slack上互動。
代碼與基礎設施
openai使用巨大的monorepo(單一代碼倉庫:一種將多個項目或代碼庫存儲在同一個版本控制系統(tǒng)中的策略,以便于跨項目協(xié)作和代碼共享),以python為主(但也有rust服務,和少量golang用于網絡代理等)。這導致代碼風格多樣:既有來自google資深工程師設計的大型庫,也有博士剛畢業(yè)寫的jupyternotebook。所有后端基本都是fastapi+pydantic構建api,而且沒有統(tǒng)一強制的風格指南。
openai完全在azure上運行。好玩的是,能真正信任的只有三項服務:azurekubernetesservice、cosmosdb、blobstore。沒有dynamo、spanner、bigquery、kinesis等aws工具,也少有自動擴展設計。iam機制也較弱,于是很多機制選擇自研。
從工程人才看,有大量來自meta→openai的背景。在很多方面,openai早期就像meta:一款轟動一時的消費者應用軟件、新興的基礎設施、行動快。大多基礎設施人才來自meta+instagram,水準很強。
把這些東西放在一起,你會看到很多基礎設施的核心部分讓人想起meta,你會看到很多meta風格的設計:內部重寫的tao、邊緣統(tǒng)一身份認證等等。我相信還有很多我不知道的。
聊天功能深入系統(tǒng)。從chatgpt起,許多代碼庫都是圍繞聊天消息和對話的思想構建的。這些源語內嵌得很深,不注意就會踩坑。codex雖有些變體(基于響應式api),但仍復用很多原先框架。
openai強調實干:沒有架構委員會決策,通常誰做誰決定。這帶來行動快的優(yōu)勢,但也常導致代碼庫里存在多個類似功能庫。我見過很多庫,比如隊列管理或代理循環(huán)。
在缺乏工具支持的快速擴張團隊里,問題也會產生:比如sa-server(后端整體)有點像垃圾場。在master上,ci崩潰的頻率比您想象的要高得多。即使是并行運行的測試用例,考慮依賴關系的子集,在gpu上運行也需要大約30分鐘的時間。這些并不是無法解決的問題,但它提醒我們,這類問題無處不在,而且當你快速擴展時,它們可能會變得更糟。好在內部已有大量精力投入改進。
其他經驗
了解什么叫“大消費者品牌”。codex推出時我才意識到這一點。這里的kpi是“專業(yè)用戶”;即便是codex,會側重用戶個人使用情況上指標,而非團隊協(xié)作。對于我這種b2b背景的人來說,這種風格很不一樣:你轉動個開關,流量就來了。
大型模型訓練機制(高層次)。這種流程從“實驗小型原型”到“擴容實跑”再到“疑難調試”一直延續(xù)。實驗時不僅調模型結構,也會調訓練數(shù)據(jù)混合;訓練變大后更像分布式系統(tǒng)工程,需要調邊緣案例(僅在極端(最大或最?。┎僮鲄?shù)或其他異常操作條件下發(fā)生的問題或情況)。
gpu數(shù)學基礎。作為codex發(fā)布的一部分,我們必須預測負載能力需求,這是我第一次真正對gpu進行基準測試。要從延遲、token數(shù)、time-to-first-token著手往下推硬件能力,而不是簡單問gpu能跑多少flops。每個模型版本的性能負載差異很大,需要重測。
在大型python代碼庫中協(xié)作。segment是兩個微服務的組合,主要是golang和typescript,我們沒有openai那樣的代碼廣度。而在openai,我學到了很多關于如何根據(jù)貢獻代碼的開發(fā)人員的數(shù)量來擴展代碼庫的知識。你必須設置更多的護欄,比如“默認工作”、“保持主界面清潔”和“難以誤用”。
發(fā)布codex
過去三個月里,我參與的最大項目是codex的發(fā)布。毫無疑問是我職業(yè)生涯中的亮點。
說下背景:在2024年11月,公司設下目標——2025年推出編程助手。到2025年2月,我們已有數(shù)個內部工具使用模型效果不錯。壓力來了——確實模型對編碼已具生產力(你看到市場上大量生成vibe-code工具)。
我提前休完陪產假回來,幫助這次發(fā)布。一周后,我們混并了兩個團隊,開啟加速沖刺。從寫第一行代碼到上線,僅用了7周。
codex沖刺是我十年職業(yè)生涯中最拼的一次。幾乎每晚工作到11點或更晚。早上5:30被新生兒叫醒,7點去辦公室,幾個周末也在辦公室。大家周周爭分奪秒,很像當年yc創(chuàng)業(yè)節(jié)奏。
這種節(jié)奏真難形容。我從沒見過哪家只花7周就從想法到完全發(fā)布并開放給所有人的產品。我們構建了一個容器運行時,對repo下載進行了優(yōu)化,對自定義模型進行了微調以處理代碼編輯,處理了各種git操作,引入了一個全新的界面,啟用了internet訪問,最終得到了一個使用起來令人愉悅的產品。那感覺,真心太爽了。
無論別人怎么說,openai依然保有那種創(chuàng)業(yè)精神(launchspirit)。
幸運的是,只要給對的人,就能創(chuàng)造奇跡。我們是一個由8名工程師,4名研究人員,2名設計師,2名市場推廣和1名產品經理組成的高級團隊。如果我們沒有這個團隊,我想我們會失敗的。沒有人需要太多的指導,但我們確實需要相當數(shù)量的協(xié)調。如果有機會和codex團隊合作,你就知道他們有多強。
發(fā)布前夜,五個人熬夜到凌晨4點布署主單體(部署耗時數(shù)小時);然后回到辦公室,參加8點的發(fā)布會和直播。打開功能開關,瞬間流量來了。我從沒見過哪個產品上線后憑借側邊欄(sidebar)就有這么爆發(fā)式流量——chatgpt的力量非常顯著。
在產品形態(tài)上,我們選擇了全異步形式。與當時的cursor(現(xiàn)在也支持后端異步模式)或claudecode不同,我們希望用戶把任務發(fā)給代理,就像給同事發(fā)pr(拉取請求);它會自動執(zhí)行,完成后返回pr。
這是個賭注:當時模型仍“好但不完美”。它能工作幾分鐘,但還做不了幾個小時。用戶對模型能力信任度參差不齊。而且到底模型真正能力在哪也還不很明朗。
我相信從長遠看,大多數(shù)編程會更像codex這種形式。但與此同時,等著看各種產品如何演化會很有趣。
codex在大型代碼庫中導航、任務管理能力特別突出。相比其它工具,我見過最大區(qū)別是它能并行觸發(fā)多個task,然后比對他們輸出。
我最近看到公共數(shù)據(jù)顯示不同大模型代理制作pr的數(shù)據(jù)量。codex已生成63萬個pr。53天內,對外公開的pr達7.8萬個/工程師;私有pr多則更多。我人生都沒做過這么有影響力的事情。
告別感言
坦白說,我最初對加入openai很擔憂。不確定放棄自由、擁有老板、融入大廠是否合適。我低調告訴朋友我加入了openai,生怕不適合就尷尬了。
我希望這次經歷能讓我:
構建對模型訓練機制及未來能力變化的直覺
與優(yōu)秀的同事一起工作并學習
推出一個偉大的產品
回顧這一年,我覺得這可能是我做過的最正確的選擇。難以想象哪能比這里學得更多。
如果你是創(chuàng)始人,覺得自己創(chuàng)業(yè)沒前景了,該深度評估是不是放棄機會打多幾次仗,要么去加入大實驗室?,F(xiàn)在是創(chuàng)造的黃金時刻,也是窺見未來方向的絕佳窗口。
我認為agi的競爭有三匹馬:openai、anthropic和google。他們會根據(jù)各自dna(消費導向vs商業(yè)優(yōu)先vs基礎架構和數(shù)據(jù)驅動)走出不同路徑。在其中工作將是開眼界。
感謝leah在深夜支持我,承擔大部分育兒任務。感謝pw、gdb、rizzo給我機會。感謝sateammates教會我很多:andrew,anup,bill,kwaz,ming,simon,tony,val。感謝codex核心團隊:albin,ae,andrey,bryan,channing,davidk,gabe,gladstone,hanson,joey,josh,katy,kevint,max,sabrina,sq,tibo,tz,will。這趟旅程我永生難忘。
懸疑丨身臨其境的錯覺,相信你會愛上她《最后一個女斂妝師》
寶藏書籍《最后一個女斂妝師》必讀章節(jié)熬夜也要追完!
直到離婚他都不愿承認自己是個渣男,他的深情專一給了別的女人
免責聲明:本文內容由開放的智能模型自動生成,僅供參考。