“云天勵(lì)飛加碼AI推理芯片,搶占第四次工業(yè)革命首張入場(chǎng)券?!?/p>
作者丨劉伊倫
編輯丨包永剛
7月30日,云天勵(lì)飛發(fā)布公告,公司已向香港聯(lián)交所遞交了發(fā)行境外上市股份(H股)并在主板掛牌上市的申請(qǐng)。這意味著,繼2023年登陸科創(chuàng)板之后,云天勵(lì)飛正邁向“A+H”雙重上市的新階段。
招股書顯示,云天勵(lì)飛是中國(guó)首家實(shí)現(xiàn)國(guó)產(chǎn)高算力AI推理芯片商業(yè)化的公司;同時(shí),也是全球范圍內(nèi)第一批推出NPU驅(qū)動(dòng)的AI推理芯片,并實(shí)現(xiàn)市場(chǎng)化落地的企業(yè)。
根據(jù)灼識(shí)咨詢報(bào)告,按2024年中國(guó)市場(chǎng)相關(guān)收入統(tǒng)計(jì),云天勵(lì)飛是中國(guó)排名前三的行業(yè)領(lǐng)先全場(chǎng)景AI推理芯片產(chǎn)品及服務(wù)提供商;在NPU驅(qū)動(dòng)的AI推理芯片產(chǎn)品及服務(wù)提供商中,公司排名中國(guó)第二。
雷峰網(wǎng)在2014年云天勵(lì)飛成立之初就開始關(guān)注這家企業(yè),自主創(chuàng)新和與時(shí)俱進(jìn)一直是它的代名詞。
“全自研、國(guó)產(chǎn)化”,在2025WAIC云天勵(lì)飛的展臺(tái)上,擺放著采用國(guó)產(chǎn)工藝及首創(chuàng)“算力積木”架構(gòu)打造的深界DeepEdge10系列芯片。
作為最早將并行計(jì)算處理器帶回國(guó)內(nèi)的一批人,云天勵(lì)飛始終深耕NPU研發(fā),從架構(gòu)設(shè)計(jì)到場(chǎng)景適配持續(xù)突破技術(shù)限制。
2020年,在被美國(guó)限制之后,云天勵(lì)飛率先將芯片生產(chǎn)切換至國(guó)產(chǎn)工藝,至此,“全自研、國(guó)產(chǎn)化”的體系正式形成。
深界DeepEdge10系列產(chǎn)品的打造,代表陳寧此前的選擇都對(duì)了。大模型進(jìn)入大規(guī)模應(yīng)用落地的浪潮之下,云天勵(lì)飛進(jìn)一步聚焦業(yè)務(wù),押注AI推理芯片。
“云天勵(lì)飛將進(jìn)一步加大在AI推理芯片領(lǐng)域的研發(fā)和投入,推動(dòng)中國(guó)搶占第四次工業(yè)革命的第一張入場(chǎng)券?!标悓幵?025WAIC期間演講時(shí)說道。
陳寧的表態(tài)絕非空言,云天勵(lì)飛已通過戰(zhàn)略調(diào)整將公司業(yè)務(wù)聚焦于AI推理芯片,構(gòu)建“1+N”業(yè)務(wù)架構(gòu),“1”即整體定位為AI芯片公司,“N”則是公司11年來積累的N個(gè)獨(dú)立業(yè)務(wù)板塊(內(nèi)部稱BU),包括AI硬件品牌嚕咔博士、智能穿戴、智算BU、政企BU等,這些BU共同為AI推理芯片平臺(tái)提供上下游支撐。
自研AI芯片,刻在云天勵(lì)飛的基因里。這家11歲的企業(yè),為何選擇這條“最有挑戰(zhàn)性”的道路?在巨頭林立、創(chuàng)業(yè)公司扎堆的AI芯片賽道中,云天勵(lì)飛優(yōu)勢(shì)何在?
01
最早把并行計(jì)算處理器帶回國(guó)的一批人
三獲吳文俊人工智能科學(xué)技術(shù)獎(jiǎng)成為百億市值的“科創(chuàng)板AI芯片第一股”推動(dòng)設(shè)立超千億規(guī)模的產(chǎn)業(yè)基金...
11歲的云天勵(lì)飛創(chuàng)造了無數(shù)的高光時(shí)刻,而故事的開始,還要從陳寧在美國(guó)的經(jīng)歷開始說起。
2001年,陳寧進(jìn)入頂尖研究型大學(xué)佐治亞理工學(xué)院攻讀電子工程博士學(xué)位,當(dāng)時(shí)著名移動(dòng)通信專家斯圖伯爾教授(GordonL.Stüber)是學(xué)院的關(guān)鍵技術(shù)領(lǐng)頭人,在他的帶領(lǐng)下,OFDM(正交頻分復(fù)用)技術(shù)實(shí)現(xiàn)了突破。
OFDM的核心是把高速串行數(shù)據(jù)拆成多路并行低速數(shù)據(jù),其并行處理邏輯與芯片設(shè)計(jì)中通過多核實(shí)現(xiàn)并行算力的邏輯存在相通性,無論是4G通信的海量數(shù)據(jù),還是AI推理的千億參數(shù),本質(zhì)上都需要高效的并行處理能力。這讓陳寧能夠更深刻地理解芯片設(shè)計(jì)。
4年后,還未畢業(yè)的陳寧就被當(dāng)時(shí)的通信巨頭“預(yù)訂”擔(dān)任高級(jí)系統(tǒng)架構(gòu)工程師。
進(jìn)入公司,陳寧領(lǐng)到的第一個(gè)任務(wù)是設(shè)計(jì)并研發(fā)第四代移動(dòng)通信(4G-LTE)多模態(tài)終端基帶芯片,原先從事算法工作的陳寧被委派去參與處理器芯片的工作,這讓他有點(diǎn)摸不著頭腦。
在當(dāng)時(shí)的技術(shù)演進(jìn)趨勢(shì)下,公司的安排不無道理——讓懂通信算法的人來做通信芯片。
2G和3G之后,4G標(biāo)準(zhǔn)開始制定。與此同時(shí),藍(lán)牙、WiFi及UWB等多種短距離無線通信技術(shù)也在并行發(fā)展,這些不同場(chǎng)景的無線技術(shù)標(biāo)準(zhǔn)共同構(gòu)成了多元化的無線通信體系。
4G實(shí)現(xiàn)了并行數(shù)據(jù)量的激增,而OFDM作為4G的核心技術(shù),最大特點(diǎn)正是通過多子載波并行傳輸提升數(shù)據(jù)吞吐量。
彼時(shí),OFDM推動(dòng)了通信芯片在并行信號(hào)處理上的技術(shù)演進(jìn),而與之形成技術(shù)呼應(yīng)的是,英偉達(dá)較早布局的GPU多核并行計(jì)算,二者分別在無線通信與通用計(jì)算領(lǐng)域探索了并行處理的技術(shù)路徑。
這段經(jīng)歷讓陳寧深刻理解,芯片不是簡(jiǎn)單的硬件設(shè)計(jì),而是要讓算法和硬件結(jié)合設(shè)計(jì)。
4G終端原型系統(tǒng)的搭建,讓陳寧作為首席代表參與4G-LTE國(guó)際標(biāo)準(zhǔn)制定,在這期間,陳寧見證了華為、中興及中國(guó)移動(dòng)等中國(guó)企業(yè)代表從最初只能在外圍旁聽,到位置不斷靠前,最后是參與國(guó)際標(biāo)準(zhǔn)的制定。
中國(guó)企業(yè)發(fā)展迅速,赴美的第九年,陳寧恰遇國(guó)內(nèi)通訊巨頭在美國(guó)組建研發(fā)中心。
2011年,陳寧承接了一個(gè)重大專項(xiàng),這個(gè)專項(xiàng),或是國(guó)內(nèi)第一個(gè)關(guān)于并行計(jì)算處理器定義的重大專項(xiàng)。
可以說,陳寧是最早把并行計(jì)算處理器帶回國(guó)內(nèi)的那一撥人。
5年間,陳寧提交了近百篇專利申請(qǐng),完成了核心IP及應(yīng)用芯片的全流程專利布局。此外,陳寧團(tuán)隊(duì)推出了全球第一款基于軟件定義無線電的4G-LTE終端芯片、設(shè)計(jì)出一系列擁有全自主知識(shí)產(chǎn)權(quán)的矢量處理器,實(shí)現(xiàn)國(guó)有處理器0的突破。
求學(xué)過程中主攻算法,進(jìn)入職場(chǎng)后,陳寧的重心轉(zhuǎn)向硬件處理器,這樣的成長(zhǎng)經(jīng)歷讓他很早就積累了算法與硬件結(jié)合的經(jīng)驗(yàn),為后來云天勵(lì)飛推動(dòng)算法芯片化埋下了伏筆。
02
自研NPU讓「深目1.0」順利上線
過往的經(jīng)歷讓陳寧對(duì)國(guó)際巨頭的動(dòng)作一直保有敏銳的注意,谷歌跟百度搶Hinton的團(tuán)隊(duì)、4億美金收購(gòu)DeepMind、AlphaGo戰(zhàn)勝人類最強(qiáng)棋手,深度學(xué)習(xí)領(lǐng)域一個(gè)個(gè)顛覆性的變化挑動(dòng)著陳寧的神經(jīng)。
深度學(xué)習(xí)是能把矢量處理器這個(gè)技術(shù)路徑完全發(fā)揮出來的領(lǐng)域。那我們何不針對(duì)深度學(xué)習(xí)去完全定義一套指令集?
跟多位業(yè)內(nèi)人士聊完之后,陳寧覺得創(chuàng)業(yè)不能再等了。
2014年,云天勵(lì)飛創(chuàng)立,正式投身NPU研發(fā);而這一時(shí)間節(jié)點(diǎn),恰好也是中國(guó)NPU產(chǎn)業(yè)的興起之時(shí)——寒武紀(jì)、深鑒科技等企業(yè)紛紛成立,共同開啟了NPU研發(fā)與商用的探索之路。
陳寧開發(fā)的第一個(gè)項(xiàng)目便是“深目”,打造“深目”系統(tǒng)所涉及的底層芯片研發(fā)讓這個(gè)創(chuàng)業(yè)公司倍感壓力。芯片是一個(gè)重資產(chǎn)、慢回報(bào)的生意。在2014年,AI還處于發(fā)展初期,一家初創(chuàng)公司說自己要做AI芯片,在投資人看來,無疑是“不切實(shí)際”。
但陳寧仍然堅(jiān)定地選擇走這條路。
深目1.0上線后,軟硬件運(yùn)行順暢,最擔(dān)心的系統(tǒng)卡頓也沒有發(fā)生,全球第一套人臉動(dòng)態(tài)識(shí)別+大數(shù)據(jù)檢索的智能技術(shù)正式運(yùn)行。
后來,陳寧向我們講述到:“神經(jīng)網(wǎng)絡(luò)處理芯片一直是我們內(nèi)部的一個(gè)核心團(tuán)隊(duì),2016年,我們第一代神經(jīng)網(wǎng)絡(luò)處理器在FPGA上實(shí)現(xiàn),今天可能還跑在龍崗公安分局的機(jī)房里,我們兩臺(tái)Nova100指令集的服務(wù)器替代了幾十臺(tái)CPU服務(wù)器?!?/p>
NNP100支持下的深目系統(tǒng)獲得成功,讓云天勵(lì)飛在三四年間,從幾個(gè)人和一間辦公室成長(zhǎng)為擁有近千員工的人工智能標(biāo)桿企業(yè)。
03
切換國(guó)產(chǎn)工藝成功流片
Nova100只是開始,芯片研發(fā)讓云天勵(lì)飛的團(tuán)隊(duì)飽受“折磨”。
當(dāng)時(shí)美國(guó)還沒有開始大規(guī)模地打壓制裁中國(guó)科技企業(yè),要用芯片,直接進(jìn)口是許多企業(yè)的選擇,但陳寧還是想自己做出專為深目系統(tǒng)打造的嵌入式視覺AI芯片。
2018年,美國(guó)封鎖芯片出口,同時(shí),云天勵(lì)飛推出DeepEye1000視覺分析SoC芯片,與通用GPU相比,DeepEye1000單位性能提升20倍。
2020年5月,云天勵(lì)飛被美國(guó)商務(wù)部納入實(shí)體清單。這意味著云天勵(lì)飛在采購(gòu)含美國(guó)技術(shù)的產(chǎn)品及使用相關(guān)技術(shù)工具時(shí)將受到嚴(yán)格限制。
這是云天勵(lì)飛面臨的又一次大考,公司需要回答一個(gè)關(guān)鍵問題:繼續(xù)在境外流片還是切換成國(guó)產(chǎn)工藝?
“2020年國(guó)產(chǎn)工藝其實(shí)不太成熟,絕大部分公司在選擇工藝的時(shí)候,首先選擇的一定不是國(guó)產(chǎn)工藝。但也是在那一年,公司決定切回國(guó)產(chǎn)工藝。”云天勵(lì)飛CTO李愛軍說道。
國(guó)產(chǎn)工藝因?yàn)榱悸实膯栴},每次流片的芯片面積不能太大,且還面臨算力密度的限制。
國(guó)產(chǎn)工藝的限制倒逼出云天勵(lì)飛的架構(gòu)創(chuàng)新,其首創(chuàng)了“算力積木”架構(gòu)以解決國(guó)產(chǎn)工藝帶來的挑戰(zhàn)。計(jì)算單元像樂高塊一樣組合,可實(shí)現(xiàn)算力的靈活擴(kuò)展、在國(guó)產(chǎn)工藝限制下拼出大算力的AI推理芯片。
2022年,云天勵(lì)飛在國(guó)產(chǎn)工藝突破上迎來關(guān)鍵里程碑,自主設(shè)計(jì)的新一代邊緣計(jì)算芯片DeepEdge10系列SoC采用國(guó)內(nèi)先進(jìn)制程工藝成功流片。
2023年,云天勵(lì)飛登陸科創(chuàng)板。
04
聚焦AI推理芯片,做難而正確的事
上市,讓云天勵(lì)飛走向新的篇章,更大的舞臺(tái)讓陳寧有底氣和決心去沖擊AI芯片研發(fā)事業(yè)新的高峰。
戰(zhàn)略聚焦AI芯片,不是一句口號(hào),而需要大量的資金和時(shí)間投入,更需要對(duì)這件事能成的篤定。
《英偉達(dá)之道》所記錄的案例,恰是歷史給出的佐證。
英特爾曾為迎合華爾街的預(yù)期,拒絕采用Arm架構(gòu)和GPU。
2006年,英特爾啟動(dòng)的LarrabeeGPU項(xiàng)目因固守x86架構(gòu),造成功耗與成本高企,最終在2010年因“無法實(shí)現(xiàn)預(yù)期利潤(rùn)”黯然終止。
同期,英偉達(dá)于2006年推出CUDA,盡管連續(xù)多年虧損,黃仁勛仍執(zhí)意深耕。
Alexnet的問世,進(jìn)一步激發(fā)了黃仁勛對(duì)人工智能的熱情,幾位關(guān)鍵副手都反對(duì)進(jìn)一步投資深度學(xué)習(xí)的情況之下,黃仁勛仍然力排眾議,堅(jiān)持“AllinAI”。
最終在AI浪潮之下,英偉達(dá)成為全球首家市值突破四萬億美元的企業(yè)。
推動(dòng)云天勵(lì)飛全面聚焦AI芯片,或許也需要巨大的決心和堅(jiān)持。
一個(gè)芯片研發(fā)團(tuán)隊(duì)需要10多個(gè)子團(tuán)隊(duì),各個(gè)團(tuán)隊(duì)每天磨合十幾個(gè)步驟,投入大、風(fēng)險(xiǎn)大。
“有時(shí)候一個(gè)BUG就毀掉你一年的付出,上億的資金打水漂?!标悓幷f到。
但AI芯片,是“不得不”做的事。
推理市場(chǎng)處在爆發(fā)前夜,今年6月,AMDCEO蘇姿豐在新品發(fā)布會(huì)上指出,AI推理計(jì)算需求未來幾年將以每年80%以上的速度增長(zhǎng),成為AI計(jì)算的最大驅(qū)動(dòng)力,且數(shù)據(jù)中心之外,AI也將部署在每個(gè)邊緣系統(tǒng)中。
對(duì)此,巨頭們動(dòng)作頻頻。
英偉達(dá)的BlackwellUltraGPU和下一代架構(gòu)VeraRubin都強(qiáng)化了推理能力。AMD則發(fā)布InstinctMI350緊隨其后。
云天勵(lì)飛也在加速奔跑。
推理市場(chǎng)和應(yīng)用深度綁定,未來AI會(huì)在云、邊、端無處不在,在陳寧的規(guī)劃下,云天勵(lì)飛推出對(duì)應(yīng)這三個(gè)領(lǐng)域的產(chǎn)品系列:深穹、深界及深擎。
云端推理加速領(lǐng)域,云天勵(lì)飛推出了基于國(guó)產(chǎn)工藝打造的深穹X6000推理加速卡,擁有超大顯存、超高顯存帶寬算力比以及卓越的編解碼能力,能夠?yàn)榇竽P屯评怼D像語義理解等任務(wù)提供高推理性能、高性價(jià)比的加速卡硬件產(chǎn)品?;谏铖稾6000Mesh加速卡,云天勵(lì)飛推出了各類推理一體機(jī),可滿足各類場(chǎng)景、不同推理任務(wù)的需求。
據(jù)悉,云天勵(lì)飛已經(jīng)在與潛在大客戶溝通,此外,下一代大算力推理芯片也即將于明年流片。
邊緣計(jì)算領(lǐng)域,十余年的產(chǎn)品實(shí)踐,讓陳寧與團(tuán)隊(duì)積累了大量技術(shù)Know-how,這是云天跑得最快的領(lǐng)域,在高密度視頻智能分析、輕量級(jí)大模型(蒸餾模型)推理等典型場(chǎng)景中,云天勵(lì)飛已落地多個(gè)示范項(xiàng)目。
端側(cè)最具想象力的是具身智能,得益于與十余家頭部機(jī)器人廠商合作的建立,云天勵(lì)飛的邊緣芯片產(chǎn)品應(yīng)用于服務(wù)型機(jī)器人已進(jìn)入實(shí)際部署階段。
2023年,DeepEdge10進(jìn)入量產(chǎn),至今一年多的時(shí)間里,DeepEdge10已經(jīng)按照陳寧的設(shè)想,在一體機(jī)、邊緣盒子、無人車及無人機(jī)等場(chǎng)景中,有序地實(shí)現(xiàn)了規(guī)?;涞亍?/p>
技術(shù)還要往前跑的,李愛軍告訴我們,第二代算力積木架構(gòu)正在研發(fā),將在新型計(jì)算、近存計(jì)算、NB-Mesh新型互聯(lián)、新型封裝、NB-link通用擴(kuò)展性等方面實(shí)現(xiàn)迭代,滿足模型對(duì)于極致推理效率、能效比及性價(jià)比的需求。
定義指令集、打造處理器生態(tài)以及十余年的NPU賽道技術(shù)沉淀,都是云天勵(lì)飛做好全自研國(guó)產(chǎn)工藝芯片的底氣。另一份厚重的家底,是公司戰(zhàn)略投資閃極科技、神州云海、智慧互通、臻識(shí)科技等下游公司,以及11年來攢下的客戶群。
“AI推理芯片成本降低,AI大規(guī)模應(yīng)用就會(huì)形成良性的產(chǎn)業(yè)循環(huán),所有的技術(shù)發(fā)展路徑都是這樣,今天,全世界產(chǎn)業(yè)里面最重要的便是打造高性價(jià)比、面向各類場(chǎng)景的AI推理芯片。”陳寧說到。
大變革時(shí)代,陳寧帶著云天勵(lì)飛奔向?qū)儆谒麄兊南乱粋€(gè)故事。
DNF:“1”字軍席卷阿拉德!霧神妮上線2小時(shí),變成了養(yǎng)豬場(chǎng)
“青蛙”專屬技能為初始化技能冷卻,3個(gè)階段分別對(duì)應(yīng)2/4/8個(gè)初始技能|。如果大家打造一般傷害較低的話,可以先把青蛙升到3階段再去挑戰(zhàn)BOSS,這樣一次性就可以刷新8個(gè)技能,基本上就是在阿拉德玩“無限火力”,就沒有打不過去的圖!“困難模式”和“普通模式”主要區(qū)別點(diǎn)在于獎(jiǎng)勵(lì):“普通模式”通關(guān)可得73個(gè)五行源流+8個(gè)賬綁、18個(gè)隕 當(dāng)然了這只是理論畫面,實(shí)際上很多時(shí)候你根本放不完8個(gè)技能,就已經(jīng)初始化冷卻了,可以說,只要把“小青蛙”升到3階段,就能實(shí)現(xiàn)全程無冷卻釋放技能了-——?!竿扑]流程」進(jìn)入霧神妮副本,建議先打“魔法書”,此時(shí)小青蛙升到2級(jí);其次再去打“拳頭圖”,獲得增傷效果,并且小青蛙升到2.5級(jí);然后再去打“解鎖圖”說完了--。《永恒島·懷舊版》詳細(xì)解說術(shù)士職業(yè)技能篇