惠吉星
新智元報道
KingHZ
【新智元導讀】不要只盯著明星AI研究員!為了打造ASI,Meta、貝索斯等狂砸百億,招聘專家當AI的「老師」。在此背景下,數(shù)據(jù)標注員的角色逐漸從基礎(chǔ)任務(wù)轉(zhuǎn)向更高技能的領(lǐng)域,門檻水漲船高。
最近,Meta成立了「超級智能」AI實驗室,四處砸錢挖人。
網(wǎng)上流傳著一份44人「超級智能」成員名單,
這收入水平可能性非常大。據(jù)報道,為了從OpenAI挖走他們的首席研究官MarkChen,扎克伯格提供了高達10億美元的薪酬提議。
值得關(guān)注的是,除了YannLeCun等部分Meta的「AI元老」,名單里大部分都是這個月新入職的員工;而且名單里有一半本科畢業(yè)于國內(nèi)的大學。
而這些「中國大學生」中,清華校友YuanzhiLi又是比較獨特的一位:之前,他是卡內(nèi)基梅隆大學的助理教授,沒有業(yè)界工作經(jīng)驗。
這份名單里另一位教授是圖靈獎得主、現(xiàn)紐約大學教授YannLeCun
普通人只能像網(wǎng)友Meet一般感嘆:平庸與卓越差距如此之大!
不過,即便是清華的畢業(yè)生、即便也是美國的教授,也不是人人都有機會參加Meta的這波「AGI選秀」。
剛剛,清華校友、杜克大學教授陳怡然發(fā)微博如此表示。
小扎這是用實際行動證明:「知識就是財富」!
和YannLeCun同榜的前教授
YuanzhiLi入職Meta已有4個月,任研究科學家;入職Meta之前,他是卡內(nèi)基梅隆大學(CMU)的助理教授。
他沒有產(chǎn)業(yè)界的工作經(jīng)歷,主要研究深度學習理論。
目前,他的谷歌學術(shù)被引次數(shù)超過了4萬,特別是2023年后,被引數(shù)開始爆發(fā)。
他是LLM微調(diào)方法低秩自適應(yīng)LoRA的合著者。
論文鏈接:https://arxiv.org/pdf/2106.09685
他還參與了微軟語言模型Phi系列的研發(fā),包括Phi-2、Phi-3、Phi-4等模型。
他還是「語言模型物理學」(PhysicsofLanguageModels)研究項目的主要參與者。
2014年,他獲得了清華大學計算機科學學士學位;2018年,他獲得了普林斯頓大學計算機科學博士學位。
不過,除了AI頂尖的研究人才,Meta在數(shù)據(jù)上也下了血本。
據(jù)報道,國際上頂級AI集團正在用高薪的行業(yè)專家替代非洲和亞洲低成本的「數(shù)據(jù)標注員」。
特別是,Meta和貝索斯狂砸百億,招聘物理學家、生物學家當「AI的老師」,打造超越人類的「超級大腦」。
數(shù)據(jù)標注行業(yè),悄悄來了一次產(chǎn)業(yè)升級。沒學歷,數(shù)據(jù)標注都干不了?
推理模型大爆發(fā)
AI數(shù)據(jù)成關(guān)鍵
ScaleAI、Turing和Toloka等AI數(shù)據(jù)服務(wù)商,正在聘請生物學和金融等領(lǐng)域?qū)<?,幫助他們?chuàng)建更復雜的訓練數(shù)據(jù)。
隨著OpenAIo3和谷歌Gemini2.5之類的推理AI模型的崛起,企業(yè)加速淘汰肯尼亞、菲律賓等國每小時薪酬不足2美元的低成本標注員。這些工人此前主要從事耗時的人工標注工作,為AI模型訓練提供海量數(shù)據(jù)集。
荷蘭的AI數(shù)據(jù)商Toloka的首席執(zhí)行官兼聯(lián)合創(chuàng)始人OlgaMegorskaya說:
「AI行業(yè)曾長期專注于模型和計算,而數(shù)據(jù)一直被忽視。終于,(AI行業(yè))開始意識到數(shù)據(jù)在訓練中的重要性?!?/p>
這一轉(zhuǎn)變導致投資者對數(shù)據(jù)標注初創(chuàng)公司興趣大增。
例如,在6月,Meta向美國的ScaleAI投資了150億美元,使其估值翻倍至290億美元,以追趕競爭對手。
同樣地,位于加州的TuringAI在3月以22億美元的估值籌集了1.11億美元資金。
貝索斯的個人公司BezosExpeditions則在5月領(lǐng)投了Toloka的7200萬美元融資輪次。
產(chǎn)業(yè)升級,專家加薪20%
過去,數(shù)據(jù)標注員處理的任務(wù)比較簡單,比如在圖像上畫框來識別對象、描述圖像內(nèi)容、選擇流利的表達方式以及從常包含暴力或圖形內(nèi)容的數(shù)據(jù)集中剔除不良答案。
由于AI模型需要海量數(shù)據(jù)提升性能,這些工人需在數(shù)秒內(nèi)處理單個任務(wù),日均完成數(shù)百項任務(wù)以構(gòu)建龐大數(shù)據(jù)庫。
然而,隨著許多任務(wù)已自動化,這些需求已經(jīng)大幅下降。這些過去從事AI最底層的工人,某種意義上被AI取代了。
肯尼亞數(shù)據(jù)標注員協(xié)會(DataLabelersAssociation)主席JoanKinyua表示,工人們現(xiàn)在被要求處理依賴本地語言技能和知識的任務(wù)。
該協(xié)會還發(fā)現(xiàn),部分任務(wù)要求標注員對AI生成的內(nèi)容進行最終質(zhì)量控制檢查。
隨著OpenAI、Anthropic和谷歌等AI巨頭努力開發(fā)ASI,而這些模型或?qū)⒊饺祟愔悄?,行業(yè)正在加大對數(shù)據(jù)集質(zhì)量的關(guān)注,雇傭?qū)<襾斫鉀Q復雜問題。
TuringAI的聯(lián)合創(chuàng)始人兼首席執(zhí)行官JonathanSiddharth表示:「現(xiàn)在需要的是人類使用模型完成腦力工作的真實數(shù)據(jù),以及模型出錯時的反饋?!?/p>
為了確保模型在從編程到物理學、金融等多個領(lǐng)域的表現(xiàn),資金雄厚的AI公司現(xiàn)在愿意支付費用,獲取更復雜的數(shù)據(jù)集,從而聘請全球的專家。
Siddharth透露,Turing為跨行業(yè)專家提供比原職高20%-30%的薪酬。盡管數(shù)據(jù)預(yù)算僅占AI公司算力支出的10%-15%,但這仍是「一筆巨款」。
Toloka的OlgaMegorskaya表示,諸如「思維鏈」之類的新功能,要讓人類專家演示如何拆解問題,之后才開發(fā)出來的。
經(jīng)驗豐富的軟件工程師可能還需根據(jù)自身領(lǐng)域設(shè)計任務(wù),并通過編寫代碼、調(diào)試程序及檢查安全漏洞來解決問題。
與此同時,驗證物理學理論需要多方協(xié)作:物理學家負責闡述如何構(gòu)建模擬器來檢驗理論真?zhèn)?,軟件工程師編寫模擬器代碼,數(shù)據(jù)科學家則分析模擬結(jié)果。
TuringAI的Siddharth指出:「由此產(chǎn)生的模型不僅會超越物理學家,更將超越物理學、計算機科學與數(shù)據(jù)科學三大領(lǐng)域頂尖人才的疊加能力?!?/p>
參考資料:
https://archive.ph/Slzih
推文+資源|類似于《我五行缺你》《步天綱》風水玄學界小說
《提燈映桃花》是一部現(xiàn)代都市背景下的降妖除魔題材小說,講述了BKing攻與清冷受之間的復雜愛情故事,融合了靈異元素?!?主要情節(jié)與角色在這個復雜的情愛故事中,護妻狂魔BKing攻與美強慘清冷受的糾葛,是這場強強對決的核心。故事中包含復仇、虐戀等元素,人物關(guān)系錯綜復雜?!?角色關(guān)系與發(fā)展攻是大魔,卻為了好了吧!
五本怪談類小說,主角膽大心細,靠智慧解決怪談和敵人!
2《都市之捉鬼天師》作者:岳十千書評:身世離奇的小屁孩王沐陽,十年后回歸都市,天生道魂,道法無邊_——。浮華都市妖魔現(xiàn)世,道心泯滅,看王沐陽如何斬妖除魔,懲戒道門敗類,將他們的后臺踩在腳下,解開身世之謎||。精彩片段:六尾妖狐連連搖頭,似乎也十分困惑,說道:“奇怪就奇怪在這里,十年前,妖道人忽然銷聲匿跡——。連山河圖說完了——。
推薦五本道士小說,主角在江湖中降妖除魔
這是由“祭酒”創(chuàng)作的小說《地煞七十二變》,發(fā)布于2017年9月22日,到現(xiàn)在已經(jīng)有七年的時間,全書總字數(shù)只有119萬|_。小說講述了一次意外讓李長安收獲了一本黃殼書,這本書帶著他穿越回了古代世界,斬殺妖魔就能獲得神通,就此踏上了降妖除魔之旅,但他沒想到這才僅僅是開始而已||。這是一部受到廣泛好評的網(wǎng)絡(luò)文學說完了。
來源:紅網(wǎng)
作者:操葉舞
編輯:全華彩
本文為紅辣椒評論 原創(chuàng)文章,僅系作者個人觀點,不代表紅網(wǎng)立場。轉(zhuǎn)載請附原文出處鏈接和本聲明。