理想汽車回應(yīng)卡車碰撞測試:目的只為驗證被動安全性能,測試結(jié)果不應(yīng)被解讀為對其他品牌產(chǎn)品質(zhì)量的論斷
作者/何己派編輯/譚璐
2023年春,清晨的斯坦福大學(xué)校園,很安靜,好未來創(chuàng)始人張邦鑫,約上CTO田密,一起散步。
二人心事重重,氣氛有點嚴(yán)肅。張邦鑫一開口,直入主題:“能不能請你放下別的所有工作,只做大模型?”
那時,ChatGPT發(fā)布已有數(shù)月,張邦鑫第一時間關(guān)注,部署了非正式預(yù)研,沒拿定主意要不要跟進(jìn)。
他帶著團(tuán)隊專程赴美,考察大模型的進(jìn)展。
一周多時間,團(tuán)隊連軸轉(zhuǎn),英偉達(dá)、谷歌等巨頭以及Figure這樣的初創(chuàng)公司,一口氣走了個遍。白天出門,夜里復(fù)盤討論。
地陪司機(jī)忍不住嘀咕:“別人都是去哪兒玩,去哪兒看show,你們公司一天安排六七個訪問行程,也太拼了。”
“走完一圈,挺受震撼,我們意識到,AI將給教育帶來巨大顛覆。”田密接受《21CBR》記者專訪時表示。
田密
那場清晨對話的最后,田密立下軍令狀——如果大模型做失敗了,就離開公司。
他帶著幾十人的隊伍,埋頭攻堅,半年時間,自研發(fā)布數(shù)學(xué)大模型MathGPT,后取名為“九章”。
“九章”在數(shù)學(xué)科目尤其出眾,2024年權(quán)威的MathEval數(shù)學(xué)能力測評中,位列國內(nèi)外數(shù)十個大模型榜首,且深度應(yīng)用到學(xué)習(xí)機(jī)等核心產(chǎn)品。
據(jù)剛披露的財報,3-5月,好未來凈收入同比增長39%,AI驅(qū)動的智能硬件業(yè)務(wù),成為重要主力。到7月末,好未來市值約480億元人民幣。
今年,田密團(tuán)隊開始推動大模型走進(jìn)公立學(xué)校,第一版產(chǎn)品“九章愛學(xué)大小屏”,已在全國四個省市試點。
“AI老師,是好未來堅定要做的方向?!碧锩芟M嫒死蠋熌芨傻氖拢磥鞟I老師都能干,且干得更好。
以下為田密自述,經(jīng)編輯整理:
押注“九章”
2022年11月底,ChatGPT問世,我們第一時間開通賬號,用完以后,大家很驚嘆。
過完春節(jié)就發(fā)現(xiàn),身邊討論的人越來越多,產(chǎn)品已經(jīng)破圈。邦鑫和我們幾個人,一直在討論,要不要跟進(jìn)。
當(dāng)時還沒買新卡,就用手頭一批英偉達(dá)V100卡,做了些預(yù)研測試。
大家覺得,還得去發(fā)源地看看,去美國一考察,感受很深刻,技術(shù)革命來了,好未來必須allin,全力投入大模型。
帶著幾十人的團(tuán)隊,我重新回到一線攻堅狀態(tài)。
大模型要順利起步,三要素的投入不能少,算力、算法人員、數(shù)據(jù),都以億為單位,很燒錢,成本投入是首要問題。
幸運的是,老板的決心很大。
起初我想過,租一批大廠的卡訓(xùn)練。邦鑫建議,自己買卡比較可控,在教育公司里,好未來的算力投入可能最大。
算法的關(guān)鍵在于人。當(dāng)時,集團(tuán)算法人員大約有100多個,幾乎全部抽調(diào)來做大模型。
好未來已積累大量教育數(shù)據(jù),而做模型的強(qiáng)化和微調(diào),光有教育垂類數(shù)據(jù)不夠。我們又專門建了一個基地,雇人做數(shù)據(jù)標(biāo)注。
最初,團(tuán)隊打算從零開始,訓(xùn)練一個自己的大模型。后來,優(yōu)秀的開源模型不斷涌現(xiàn),自己做預(yù)訓(xùn)練,不劃算。
我們果斷切換方向,基于DeepSeek、LLaMA等開源模型,結(jié)合學(xué)而思獨有的教育數(shù)據(jù),進(jìn)行二次訓(xùn)練,再用多個模型進(jìn)行交叉驗證和投票,得到專業(yè)的教育大模型。
站在巨人肩膀上,模型能力大幅提升。
數(shù)學(xué)是大模型應(yīng)用最具挑戰(zhàn)的領(lǐng)域之一。做大模型的廠商很多,從數(shù)學(xué)切入的,只有好未來。
好未來做數(shù)學(xué)培訓(xùn)起家,積累很多,2017年就成立AILab,有傳統(tǒng)AI打下的地基,過渡下來,過程很順。
我們花了半年,做出了MathGPT第一版,2023年11月,MathGPT成為首批通過備案的教育大模型。
“九章”這個名字,源自《九章算術(shù)》,是世界上最早的印刷本數(shù)學(xué)書?!熬耪隆焙寐牶糜浨矣泄适拢蠹胰∶麤]有糾結(jié),一致通過。
傳統(tǒng)AI時代,針對多個應(yīng)用場景,我們要用到上百個小模型,好未來就開發(fā)了大量AI助手,協(xié)助老師備課、批改作業(yè)等,功能較為零散、簡單。
現(xiàn)在,一個大模型能搞定很多事。
更重要的變化在于,AI能力正逐步強(qiáng)大,能實現(xiàn)教、學(xué)、練的閉環(huán),從過去以老師為中心,真正轉(zhuǎn)向以學(xué)生為中心。
軟硬結(jié)合
做大模型不是炫技,幫用戶解決現(xiàn)實問題,才是第一位的。
九章大模型以數(shù)學(xué)起家,已將能力延伸到全學(xué)段、全學(xué)科。
比如,語文學(xué)科,提供作文輔導(dǎo)寫作、作文批改等功能;英語學(xué)科,提供英語作文批改、口語對話練習(xí)等功能。
最早,團(tuán)隊從AI解題這項能力做起,我們很快意識到,這不是實際痛點。家長要的是AI能給孩子批改作業(yè),把錯題講明白,減少他們輔導(dǎo)作業(yè)的工作量,降低請家教的成本。
九章就選擇聚焦三個方向——批改、講題、精準(zhǔn)練。
傳統(tǒng)AI,只能批改選擇題、判斷題等簡單題型;一有大模型,不光支持所有題型,且在批改過程中,能指出答題錯在哪步,具體關(guān)聯(lián)哪個知識點。
至于講題,好未來會實打?qū)嵱?xùn)練AI老師,劃分6個維度的指標(biāo),由真人老師打分,評價其講題的邏輯性、過程的連貫性等。
所謂精準(zhǔn)練,基于知識圖譜,從孩子做對或做錯一道題,AI可判斷其是否掌握知識點,精準(zhǔn)推送孩子需要的題目。
這些技術(shù)能力,正以多種應(yīng)用方式落地,既嵌入好未來現(xiàn)有的APP、智能硬件和學(xué)習(xí)服務(wù),也有獨立的APP和小程序“九章愛學(xué)”,并提供API和智能體接口。
我們也逐漸認(rèn)清一個現(xiàn)實:純AI軟件很難單獨落地,軟硬結(jié)合可能是現(xiàn)在唯一的出路。
在教育硬件,學(xué)習(xí)機(jī)的復(fù)雜程度又最高。
2023年2月,好未來推出第一代學(xué)而思學(xué)習(xí)機(jī),定價4000多元,錨定“好內(nèi)容”,當(dāng)時有人估算,僅內(nèi)置的課程資源,至少等于30萬元的培訓(xùn)費。
到第二代產(chǎn)品,大模型能力接入,升級為“好內(nèi)容+好AI”,“好AI”即九章與DeepSeek形成的雙核大模型,強(qiáng)化學(xué)習(xí)機(jī)的智能交互與精準(zhǔn)分析能力。
今年5月,我們又發(fā)布旗艦產(chǎn)品T系列,搭載小思智慧島Pro,這是個軟硬一體化的攝像頭體系。學(xué)生伏在桌上寫作業(yè),攝像頭能直接拍到紙上題目,可智能提供作業(yè)輔導(dǎo)。
我們正在努力,往多模態(tài)AI老師的方向進(jìn)化,省去每次主動喚醒AI的動作,這樣,桌面放上教科書或試卷,學(xué)生手寫時,攝像頭實時查看,實時按步驟講解,如同真人老師面對面輔導(dǎo)。
配合學(xué)習(xí)機(jī)等硬件的更新,九章大模型的AI能力,也保持以月為單位的迭代節(jié)奏。
提速進(jìn)化
我們已開啟AI產(chǎn)品進(jìn)校業(yè)務(wù),2024年底立項,今年3月推出第一版ToG的學(xué)習(xí)機(jī)。
第一批試點,已有三個月時間。
據(jù)學(xué)校反饋,兩個班級對比,有AI工具賦能的班級,數(shù)學(xué)成績的均分,較另一個班高出7分,預(yù)測學(xué)期末將拉開十幾分的差距。
AI進(jìn)校,有個逐漸接受的過程,關(guān)鍵在于信任和效果,我們有耐心,也有信心。
我們內(nèi)部,也在鍛造AI化組織。
一是轉(zhuǎn)變思路,業(yè)務(wù)遇到問題,先問大模型,能不能做、怎么做;二是工作內(nèi)容的“AI率”提升。
內(nèi)部明確要求,未來數(shù)月,至少有某項工作由AI替代,如法務(wù)、財務(wù)的合同審核,基本交給大模型,大幅提效。
核心技術(shù)路線上,好未來會堅定走向“AI老師”。如同無人駕駛等級的L0到L5,教育行業(yè)的AI老師,大體也是如此進(jìn)階。
L1級別,AI只能打輔助,做些簡單重復(fù)的工作。
當(dāng)前所處的L2,AI能勝任某個模塊,比如作業(yè)批改,屬于“輔助駕駛”階段,老師可以“脫手”“脫腳”,不能“脫眼”。
L3級別,進(jìn)入“有條件的無人駕駛”,可部分“脫眼”,不能“脫腦”。我們希望,未來兩三年能實現(xiàn)L3。
比如,家庭場景下,學(xué)習(xí)平板里的AI老師,可自主幫忙完成學(xué)業(yè)規(guī)劃,也能實現(xiàn)做題-批改-講題-練題的完整閉環(huán)。
一旦到L4級別,AI老師可跨場景切換,家長能放心把孩子的學(xué)習(xí)交給AI,除非出現(xiàn)個別極端情況,基本不用接管。
那時,教育業(yè)將迎來徹底變革。
我入局大模型兩年,感到壓力最大的,是剛接下任務(wù)時,一切未知,不知從何著手。
現(xiàn)在心里踏實多了,應(yīng)對挑戰(zhàn)的方法論,也很明確:從用戶使用過程和經(jīng)驗中發(fā)現(xiàn)不足,思考技術(shù)改進(jìn)的路徑,探討更豐富的交互形態(tài)。
就個人而言,之前十幾年,待在騰訊、阿里,花名一直是“老師”。或許,冥冥之中就已確定我的角色。
6本帶甜味的純愛小說:《淡彩》暖心,《小得盈滿》從頭到尾發(fā)糖
元氣可愛女主文大合集,個個古靈精怪,軟萌俏皮,甜寵滿分!
5本甜蜜有愛的現(xiàn)代萌寶文,看小包子如何神助攻,可愛爆棚??愛看...