陳怡盈
明敏發(fā)自凹非寺量子位|公眾號QbitAI
不靠囤算力,拿下數(shù)家大模型明星公司訂單。
93年創(chuàng)始人掌舵的清華系計(jì)算創(chuàng)業(yè)公司,有點(diǎn)出其不意。
2023上半年,百模大戰(zhàn)開啟,模型預(yù)訓(xùn)練需求空前爆發(fā),在算力焦慮下,囤積算力成為一種趨同性動作,更充裕的算力幾乎就等于金額更高的訂單。
10億、甚至50億,誘惑非常大。
站在暴風(fēng)眼最核心,創(chuàng)始人閆博文沒有這么做。從技術(shù)角度出發(fā),他知道未來算力一定會有閑置,瘋狂囤算力對于一家技術(shù)公司而言似乎也不夠makesense。
而且從結(jié)果看,這也不影響他拿大單百度、Kimi以及視頻生成賽道頂尖玩家生數(shù)科技等,都選擇與他們合作。
So,why?
3次獲得戈登·貝爾獎(jiǎng)
是石科技創(chuàng)立于2021年,團(tuán)隊(duì)從國家超級計(jì)算無錫中心孵化而來,是國內(nèi)最早將超算智算并行優(yōu)化的技術(shù)進(jìn)行產(chǎn)業(yè)化的團(tuán)隊(duì)之一。
創(chuàng)始人兼董事長閆博文,出生于1993年,畢業(yè)于清華大學(xué),是清華計(jì)算機(jī)系博士后。主要研究方向包括計(jì)算機(jī)應(yīng)用技術(shù)、高性能計(jì)算、并行優(yōu)化等。
博士期間,閆博文參與了國家超級計(jì)算無錫中心項(xiàng)目,主要實(shí)現(xiàn)將CFD整體算法移植到國產(chǎn)超算“神威·太湖之光”上。
“神威·太湖之光”,在超算領(lǐng)域這個(gè)名字絕不陌生,它是世界上首臺峰值運(yùn)算性能超過每秒10億億次浮點(diǎn)運(yùn)算能力的超級計(jì)算機(jī),在2016年-2017年連續(xù)兩年位居全球TOP500超算榜首。
△國家超級計(jì)算無錫中心鹽城分中心
它最大的特點(diǎn)是完全使用國產(chǎn)芯片(申威26010)構(gòu)建,高度異構(gòu)、并行度極高(>10,000,000核心線程)。由于不同于x86、ARM、CUDA等國際主流計(jì)算生態(tài),意味著多數(shù)軟件算法都要重寫或者重構(gòu)。
閆博文主要參與的項(xiàng)目,就是廣泛應(yīng)用于工業(yè)仿真、航空航天、氣候氣象領(lǐng)域的計(jì)算流體力學(xué)(CFD)算法移植到“神威·太湖之光”上,需要對算法的底層數(shù)據(jù)結(jié)構(gòu)、并行任務(wù)調(diào)度、線程級任務(wù)劃分、內(nèi)存訪問策略全部做重新設(shè)計(jì)。
△國家超級計(jì)算無錫中心
這項(xiàng)工作涉及國產(chǎn)芯片、國產(chǎn)算法、國產(chǎn)應(yīng)用的全流程打通,驗(yàn)證了國產(chǎn)超算不僅“快”,而且“好用”。
也是這次經(jīng)歷,讓閆博文看到了國產(chǎn)算力軟硬件適配的需求強(qiáng)烈,產(chǎn)業(yè)界對高性能計(jì)算、國產(chǎn)可替代的呼聲越來越高,由此成立是石科技。
團(tuán)隊(duì)的核心成員大多來自國家超算無錫中心并行優(yōu)化團(tuán)隊(duì),擁有深厚的高性能計(jì)算和并行優(yōu)化背景,曾3次獲得全球高性能計(jì)算領(lǐng)域最高獎(jiǎng)項(xiàng)——“戈登·貝爾獎(jiǎng)”,是國內(nèi)首個(gè)拿下該獎(jiǎng)項(xiàng)、也是唯一一個(gè)3次獲得該獎(jiǎng)項(xiàng)的團(tuán)隊(duì)
戈登·貝爾獎(jiǎng)(GordonBellPrize)是高性能計(jì)算(HPC)領(lǐng)域的國際最高獎(jiǎng)項(xiàng),被譽(yù)為高性能計(jì)算應(yīng)用領(lǐng)域的“諾貝爾獎(jiǎng)”,由全球最大的計(jì)算機(jī)學(xué)術(shù)組織ACM(國際計(jì)算機(jī)協(xié)會)頒發(fā)。
此外,團(tuán)隊(duì)也多次獲得由中國計(jì)算機(jī)學(xué)會(CCF)頒發(fā)的“中國版戈登·貝爾獎(jiǎng)”——CCF年度最佳應(yīng)用獎(jiǎng)。
如此技術(shù)積累下,是石科技在2021年正式成立。
這時(shí),距離ChatGPT誕生不到2年。從時(shí)間維度看,是石科技似乎是提前搶占風(fēng)口,在AI計(jì)算需求爆發(fā)前完成了底層計(jì)算能力構(gòu)建。
但在當(dāng)時(shí),業(yè)內(nèi)對于大模型是否應(yīng)該繼續(xù)卷參數(shù)規(guī)模都還有諸多爭議,沒什么人能預(yù)料到后來ChatGPT引爆的趨勢,更別提背后的AI大規(guī)模計(jì)算需求,熱度遠(yuǎn)不及當(dāng)下。
說是石預(yù)判了AI趨勢,確實(shí)不合理……但如果不是對趨勢有預(yù)估,為何它能穩(wěn)穩(wěn)承接突然爆發(fā)的AI計(jì)算需求,并不斷拿大單?
創(chuàng)始人閆博文似乎并不覺得這應(yīng)該是個(gè)問題,因?yàn)椋?/p>
無論大模型爆不爆發(fā),我們都一定會長期從事高性能計(jì)算這一行。
不是什么火就做什么,始終從計(jì)算維度做判斷
如此判斷,有來自實(shí)際需求、國家戰(zhàn)略的影響,當(dāng)然也有源自技術(shù)公司長期主義的思考。
時(shí)間回到2021年,高性能計(jì)算產(chǎn)業(yè)本身的風(fēng)口更早浮現(xiàn)。
國家戰(zhàn)略方面,2020年“新基建”被首次寫入政府工作報(bào)告,算力與AI被明確列為重點(diǎn)方向。2021年《“十四五”數(shù)字經(jīng)濟(jì)發(fā)展規(guī)劃》中,算力建設(shè)作為數(shù)字經(jīng)濟(jì)發(fā)展的核心基礎(chǔ)設(shè)施,被明確納入國家戰(zhàn)略。中國高端算力也被列入“戰(zhàn)略資源”。
這個(gè)時(shí)間節(jié)點(diǎn)很像互聯(lián)網(wǎng)爆發(fā)前期。2000年左右,寬帶、服務(wù)器、CDN的基礎(chǔ)設(shè)施鋪好后,才有了新浪、百度、阿里、騰訊的起飛。2021年的高性能計(jì)算,正處于同樣的拐點(diǎn)
更何況產(chǎn)業(yè)側(cè)本身的需求也很明顯。閆博文提到,當(dāng)時(shí)已經(jīng)在科研、工業(yè)等領(lǐng)域看到了對大規(guī)模數(shù)值模擬的強(qiáng)烈需求。同時(shí)也觀察到國內(nèi)在算力平臺建設(shè)方面還處于早期,企業(yè)缺乏算力供應(yīng),也缺乏專業(yè)團(tuán)隊(duì)維護(hù)——供需不平衡的問題亟需解決,需要有專業(yè)團(tuán)隊(duì)來調(diào)節(jié)這一問題。
由此,是石科技成立。要做的事就兩件:
提高計(jì)算效率降低計(jì)算成本
核心業(yè)務(wù)是IaaS和模型專家模型服務(wù)
△是石科技核心業(yè)務(wù)
核心技術(shù)是并行計(jì)算,這其中包括對計(jì)算系統(tǒng)中計(jì)算、存儲、網(wǎng)絡(luò)等方面的一系列優(yōu)化,CPU、GPU異構(gòu)計(jì)算的調(diào)配;本質(zhì)上是通過軟硬結(jié)合讓用戶的算法以最適配的方式規(guī)?;渴鹪谟布稀?/p>
在創(chuàng)立早期,是石就構(gòu)建了包括超算和智算在內(nèi)的底層算力,并向上搭建算力調(diào)度平臺、Infra優(yōu)化框架以及應(yīng)用服務(wù)在內(nèi)的全棧能力。目前已構(gòu)建起HAI統(tǒng)一計(jì)算平臺。
△是石科技HAI統(tǒng)一計(jì)算平臺
算力層:管理約10余個(gè)智算中心2個(gè)國家級超算中心/訓(xùn)練場,總算力規(guī)模超過10000PFlops。其中:鹽城超級計(jì)算中心獲批“國家新一代人工智能公共算力創(chuàng)新平臺”;是石科技總部落戶浙江平湖市,并建成超智融合計(jì)算平臺;北京經(jīng)開區(qū)模數(shù)世界成立是石科技模型調(diào)優(yōu)工廠。HAI框架層:提供支持多種型號CPU和GPU的算力調(diào)度、納管,訓(xùn)練+推理的一體化平臺,以及AI算子庫和行業(yè)算子庫的深度優(yōu)化庫環(huán)境。服務(wù)超過20余個(gè)應(yīng)用領(lǐng)域,200多項(xiàng)應(yīng)用課題,200萬個(gè)作業(yè)任務(wù),HAI框架經(jīng)多場景落地驗(yàn)證的部署、調(diào)度與優(yōu)化能力得到眾多用戶認(rèn)可。模型層:提供基礎(chǔ)模型優(yōu)化和行業(yè)專家模型優(yōu)化訓(xùn)練推理服務(wù),專家模型覆蓋高端制造、生物醫(yī)藥、醫(yī)療健康等領(lǐng)域。
△是石科技行業(yè)專家模型服務(wù)
在此技術(shù)?;A(chǔ)上,大模型趨勢爆發(fā),把是石更進(jìn)一步推向臺前。
從2023年到現(xiàn)在,AI計(jì)算需求大、而且變化快。無論是基礎(chǔ)模型廠商,還是有AI模型訓(xùn)推的企業(yè),都需要有更專業(yè)的團(tuán)隊(duì)為其優(yōu)化算法與算力配置。
在這之中,是石科技為月之暗面、生數(shù)科技、瑞萊智慧、愛詩科技、云道智造等頭部企業(yè),以及清華大學(xué)、北京大學(xué)、香港科技大學(xué)等頭部高校,均提供了算力及優(yōu)化服務(wù),且不同領(lǐng)域客戶面對的挑戰(zhàn)不盡相同。
△是石科技HAI平臺運(yùn)行結(jié)果
比如視頻生成方面,文生視頻、圖生視頻…不同任務(wù)的計(jì)算需求不同,在底層算力上也要做好劃分,這就更考驗(yàn)對計(jì)算本身的理解,使用CPU、GPU還是異構(gòu)計(jì)算?不同類型計(jì)算配比如何?怎樣能盡可能降低通道擁堵?越是細(xì)節(jié)的問題,就越考驗(yàn)運(yùn)維團(tuán)隊(duì)的功力。
以及視頻任務(wù)本身就更“燒卡”,對成本考驗(yàn)更大。如何為客戶優(yōu)化算力構(gòu)成,讓同一任務(wù)以相同的完成度跑在更低配置的卡上,也是對團(tuán)隊(duì)優(yōu)化能力的考驗(yàn)。
據(jù)閆博文透露,是石科技在過去2年陪伴多家基礎(chǔ)模型公司走完模型訓(xùn)練、推理等階段,推動其基礎(chǔ)模型快速上線、以及對外提供穩(wěn)定優(yōu)質(zhì)服務(wù)。
另外在大模型垂直領(lǐng)域研發(fā)上,是石科技也為高??蒲袌F(tuán)隊(duì)、企業(yè)提供底層計(jì)算優(yōu)化服務(wù)。是石科技攜手深圳大學(xué)大數(shù)據(jù)國家工程實(shí)驗(yàn)室、南方科技大學(xué)風(fēng)險(xiǎn)分析預(yù)測與管控研究院、深圳市淵維科技有限公司發(fā)布財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警推理一體機(jī),基于推理大模型與財(cái)務(wù)專家經(jīng)驗(yàn),為投資機(jī)構(gòu)與個(gè)人客戶提供高效的風(fēng)險(xiǎn)預(yù)警解決方案。
目前,是石科技的業(yè)務(wù)占比中,AI計(jì)算帶來的營收占比超過50%,特點(diǎn)是大單多。與之對應(yīng),科學(xué)計(jì)算領(lǐng)域的訂單則呈現(xiàn)出“客戶多”的特點(diǎn),當(dāng)下也依舊是是石科技業(yè)務(wù)的主要構(gòu)成部分。
在閆博文看來,雖然科學(xué)計(jì)算不是新風(fēng)口,但是它的算力需求更剛性更結(jié)構(gòu)化,比如工業(yè)模擬仿真、氣象預(yù)測等領(lǐng)域。
有時(shí)候一個(gè)仿真系統(tǒng)的物理時(shí)間要求是幾秒鐘,它背后的模型計(jì)算量是數(shù)十倍于普通AI推理的。
如今隨著AI大火,科學(xué)計(jì)算也與AI進(jìn)一步融合。比如在航空航天領(lǐng)域,既需要上千核并行的仿真程序,也需要跑神經(jīng)網(wǎng)絡(luò)的AI模型。
總之,作為計(jì)算優(yōu)化領(lǐng)域的資深玩家,是石判斷做什么、不做什么,更多是從計(jì)算本身的需要出發(fā),而不是簡單跟隨趨勢。
但這其實(shí)要求自身對行業(yè)有深刻理解,要知道這兩年算力行業(yè)的變化瞬息萬變,趨勢預(yù)估變得更加困難,甚至充滿誘惑
比如開頭提到的,閆博文從算力供需平衡的角度出發(fā),認(rèn)為公司已經(jīng)沒必要囤算力,后續(xù)可以依靠調(diào)度閑置算力服務(wù)客戶。但這就意味著,他們不僅要頂住巨大算力焦慮,也要頂住數(shù)十家算力中心的前置簽約誘惑。
從一個(gè)創(chuàng)業(yè)公司角度,擺過來一個(gè)10億、甚至50億的訂單,誘惑力非常大,但它也可能是個(gè)糖衣炮彈。
那么閆博文的判斷邏輯是什么?
2023年國家新一代人工智能公共算力平臺建成、上千家算力中心或建成或在規(guī)劃中,這意味著算力緊張只是暫時(shí)的,未來一定存在大量閑置算力。如果參與了這場“囤積算力”的豪賭,一旦沒有把握時(shí)機(jī),很可能在供需快速變化中面臨虧本。
因?yàn)樗懔Φ恼叟f是非??斓?,一旦事先囤積、發(fā)生空置,就有成本損耗,而且是白白浪費(fèi)。如果一年之中空置了一個(gè)月,相當(dāng)于這一年都白干了。
如今在2025年回看,這種判斷正確且理性。雖然摩爾定律開始失效,但是“老黃定律”出現(xiàn),底層芯片的供應(yīng)并沒有預(yù)料中如此嚴(yán)峻。同時(shí)國產(chǎn)算力再進(jìn)一步跟上,為市場提供更豐富選擇。
當(dāng)然,這種判斷也一定不只依賴于技術(shù)認(rèn)知,還有個(gè)人風(fēng)格影響。
畢竟大模型趨勢如火如荼,不是誰都能克制且不焦慮的。
93年創(chuàng)始人帶隊(duì),松弛感十足
由93年創(chuàng)始人掌舵的是石,整體團(tuán)隊(duì)都相當(dāng)年輕,團(tuán)隊(duì)成員中60%的90后,20%的00后。
年輕的好處,就是不容易內(nèi)耗。上億的訂單做不做,一天內(nèi)即可決策出來。
這種不內(nèi)耗,在閆博文身上更明顯。
技術(shù)趨勢演進(jìn)如此快,獨(dú)角獸林立、入場玩家越來越多,大家都擔(dān)心自己掉隊(duì)或者沒能乘上時(shí)代的東風(fēng)。
我們問,介意行業(yè)出現(xiàn)更多競爭玩家嗎?
閆博文:不介意,玩家越多市場越大。
也不焦慮?
閆博文:不焦慮。我們目前就是在有限范圍內(nèi)擴(kuò)張和投入,不寄希望于投入10個(gè)億下去,做個(gè)標(biāo)準(zhǔn)化產(chǎn)品出來,然后大家就都用起來了。和我們預(yù)判到的技術(shù)路線相違背
那是石科技看到的技術(shù)趨勢是什么?
越優(yōu)化的東西,通用性越差
看似悖論,實(shí)則道出計(jì)算領(lǐng)域長期存在的一個(gè)結(jié)構(gòu)性張力:性能vs通用性
比如針對某個(gè)任務(wù)/芯片/模型深度定制,如CUDAkernel手寫、硬件深度綁定、數(shù)據(jù)布局精調(diào),性能爆炸性提升,但很難遷移到其他任務(wù)或平臺;如果是PyTorch這類通用接口,適配范圍廣,開發(fā)效率高,但犧牲性能、調(diào)度、資源利用率。
對于正在爆發(fā)的算力領(lǐng)域,也將遵循這一規(guī)律,逐漸從通用計(jì)算走向場景計(jì)算。
閆博文認(rèn)為,未來的計(jì)算中心將不再以地區(qū)作為劃分依據(jù),而更應(yīng)該是某個(gè)計(jì)算中心集中處理某一類計(jì)算任務(wù),類似于專攻某一場景。這樣能集中做優(yōu)化,也能進(jìn)一步提高算力資源利用率。
這種思想在是石的產(chǎn)品中亦有體現(xiàn),在模型服務(wù)劃分上,團(tuán)隊(duì)也遵循以場景作為分類標(biāo)準(zhǔn)。
而對于行業(yè)來說,真正的挑戰(zhàn)是:如何在通用與優(yōu)化之間找到“高效、可復(fù)制、快速定制”的平衡點(diǎn)。行業(yè)距離抵達(dá)這樣的終點(diǎn),還有很長的路要走。
換言之,在算力領(lǐng)域,貪圖一時(shí)的快速擴(kuò)張可能會違背行業(yè)發(fā)展規(guī)律。選擇以慢打快,焦慮自然也不存在。
長遠(yuǎn)來看,是石科技則希望未來作為用算力賦能各行各業(yè)的代表,也能打出類似“MadeinChina”的影響力——PoweredbyMETASTONE是石,這是對未來愿景的終極暢想。
回歸當(dāng)下,是石科技要做的就是為客戶提供好算力與模型優(yōu)化服務(wù),進(jìn)一步提高效率優(yōu)化成本。
今年,一直沉于水面之下的是石科技開始更多對外亮相。在剛剛落幕的WAIC2025大會上,是石科技團(tuán)隊(duì)也做了進(jìn)一步分享;同時(shí),新的標(biāo)準(zhǔn)化產(chǎn)品即將發(fā)布、新一輪融資也正在籌備中,可以說是技術(shù)儲備的一次大釋放。
所以,在AI爆發(fā)的趨勢里,哪有什么“小荷才露尖尖角”,更多都是“早有蜻蜓立上頭”。
你覺得呢?
OneMoreThing
最后,如果一定要問,當(dāng)boss有什么焦慮點(diǎn)。
閆博文也相當(dāng)坦誠:
焦慮客戶滿不滿意、擔(dān)心成員吵不吵架、錢夠不夠用…
嗯,果然是90、00后為主的團(tuán)隊(duì),就是有啥都不掖著(doge)。
《2021中國K12在線英語發(fā)展藍(lán)皮書》發(fā)布??環(huán)球網(wǎng)
3月35日,南方周末聯(lián)合中國科學(xué)院計(jì)算技術(shù)研究所大數(shù)據(jù)研究院及益普索中國(咨詢)有限公司發(fā)布《2021中國K12在線英語發(fā)展藍(lán)皮書》(以下簡稱“藍(lán)皮書”)--。藍(lán)皮書顯示,對于在線英語行業(yè)的變革,大部分用戶持樂觀態(tài)度,并愿意接受新的教育方式,對于未來教育的變化也是充滿期待_|。產(chǎn)品升級、下沉市場是兩大潮流對于在線英語品牌好了吧!
考研江湖一直流傳著一個(gè)傳說:英語要想80+,藍(lán)黃兩書必須刷!
2021年3月,南方周末聯(lián)合中國科學(xué)院計(jì)算技術(shù)研究所大數(shù)據(jù)研究院及益普索中國(咨詢)有限公司發(fā)布《2021中國K12在線英語發(fā)展藍(lán)皮書》(以下簡稱《藍(lán)皮書》)|。《藍(lán)皮書》顯示,在線英語教育行業(yè)從追求規(guī)模逐漸轉(zhuǎn)為追求效能,專注產(chǎn)品升級,瞄準(zhǔn)下沉市場。伴隨用戶學(xué)習(xí)需求的深化、知識付費(fèi)意識的覺醒和消費(fèi)能力的升級,中國K12說完了|。
《2021中國K12在線英語發(fā)展藍(lán)皮書》發(fā)布,51Talk滿意度位居前列
【環(huán)球網(wǎng)教育報(bào)道】3月25日,中國科學(xué)院計(jì)算技術(shù)研究所大數(shù)據(jù)研究院、益普索中國聯(lián)合南方周末發(fā)布《2021中國K12在線英語發(fā)展藍(lán)皮書》(以下簡稱《藍(lán)皮書》),綜合1500份調(diào)研問卷及多位用戶的深度訪問分析得出:疫情推動在線英語教育升溫,頭部品牌持續(xù)穩(wěn)固市場,但行業(yè)洗牌加劇,51Talk、猿輔導(dǎo)分別位列在線英語類及綜合網(wǎng)課類希望你能滿意-。
來源:紅網(wǎng)
作者:權(quán)修竹
編輯:胡雅茹
本文為紅辣椒評論 原創(chuàng)文章,僅系作者個(gè)人觀點(diǎn),不代表紅網(wǎng)立場。轉(zhuǎn)載請附原文出處鏈接和本聲明。