謝泓圣
AI分為訓(xùn)練與推理兩大環(huán)節(jié)。
訓(xùn)練如同“學(xué)生學(xué)習(xí)知識(shí)”,需海量數(shù)據(jù)和超強(qiáng)算力;推理則像“學(xué)生考試答題”,要求快速響應(yīng)現(xiàn)實(shí)問題。隨著AI應(yīng)用場(chǎng)景的普及,推理算力需求不斷提升,據(jù)IDC數(shù)據(jù)顯示,2022年云端推理算力占比已達(dá)58.5%,預(yù)計(jì)2026年將升至62.2%。
如今,一家上市公司在11年間研發(fā)端側(cè)AI芯片之后,選擇發(fā)力大模型推理算力。
7月25日消息,2025年世界人工智能大會(huì)(WAIC)前夕,AI上市公司云天勵(lì)飛(688343.SH)對(duì)外發(fā)布深穹Edge200芯片,以及全新深穹X6000Mesh推理計(jì)算卡等產(chǎn)品。
據(jù)悉,深穹X6000Mesh推理加速卡的算力達(dá)256Tops,主要定位于AI推理計(jì)算,支持30fps的1080p256路的視頻解碼,可實(shí)現(xiàn)千億參數(shù)大模型推理應(yīng)用。
同時(shí),基于深穹X6000Mesh加速卡,云天勵(lì)飛提供深目6203視頻高密2U推理一體機(jī)、天舟6408大模型4U推理一體機(jī),以及天舟680G大模型滿血版8U推理一體機(jī)等產(chǎn)品,最高可達(dá)4PFlops(每秒執(zhí)行4千萬億次浮點(diǎn)運(yùn)算)推理算力,助力AI模型商業(yè)落地。
云天勵(lì)飛董事長(zhǎng)兼CEO陳寧對(duì)筆者表示,公司全面聚焦AI推理芯片。2025年是AI發(fā)展的重要轉(zhuǎn)折點(diǎn),大模型技術(shù)不斷成熟,模型調(diào)用成本顯著降低。同時(shí),當(dāng)前AI推理芯片市場(chǎng)仍處于藍(lán)海階段,其市場(chǎng)規(guī)模相較于數(shù)千億美元的訓(xùn)練芯片市場(chǎng)尚顯微小,但預(yù)計(jì)未來三至五年內(nèi),AI推理芯片的增長(zhǎng)速度將大幅超越訓(xùn)練芯片。這不僅意味著AI從訓(xùn)練時(shí)代邁入推理時(shí)代,也預(yù)示推理算力需求將迎來爆發(fā)式增長(zhǎng)。
陳寧稱,未來五年(2030年),AI將重塑所有機(jī)器人、AI眼鏡等終端硬件產(chǎn)品,推理算力網(wǎng)絡(luò)將無處不在。而作為底層算力設(shè)施,AI推理芯片將貫穿端、邊、云,形成無處不在算力網(wǎng)絡(luò),從而讓各類Agent能夠服務(wù)人類的工作和生活。
陳寧強(qiáng)調(diào),未來云端推理算力會(huì)率先迎來爆發(fā),并不斷探索新的應(yīng)用場(chǎng)景。一旦新場(chǎng)景通過云服務(wù)形成價(jià)值閉環(huán),實(shí)現(xiàn)從1到100的大規(guī)模復(fù)制,同時(shí)在性價(jià)比提升、成本降低上取得突破,市場(chǎng)就有望向更大規(guī)模的邊緣推理計(jì)算拓展。最終,必然會(huì)形成終端、邊緣、云端全棧式的協(xié)同分工模式,推動(dòng)AI大規(guī)模落地并具備最優(yōu)的性價(jià)比。
研發(fā)11年NPU之后,這次為何要發(fā)力模型推理算力卡?
云天勵(lì)飛成立于2014年,擁有大模型和AI芯片兩大技術(shù)平臺(tái),打造了面向消費(fèi)級(jí)、企業(yè)級(jí)、行業(yè)級(jí)三大類場(chǎng)景的業(yè)務(wù)。
2023年,云天勵(lì)飛成功在上交所科創(chuàng)板上市,曾一度被稱為“深圳AI第一股”。
技術(shù)方面,云天勵(lì)飛自研“算力積木”架構(gòu),以及神經(jīng)網(wǎng)絡(luò)處理器核心IP和芯片,聚焦大模型高效推理,為AI的普惠應(yīng)用提供算力支撐,滿足多樣化應(yīng)用場(chǎng)景對(duì)AI算力的需求。
早在2020年,云天勵(lì)飛全面轉(zhuǎn)向國(guó)產(chǎn)工藝,成為首家采用國(guó)產(chǎn)Chiplet工藝的AI芯片公司。
2023年,云天勵(lì)飛正式發(fā)布基于“算力積木”架構(gòu)打造的DeepEdge10芯片平臺(tái),并推出DeepEdge10C、DeepEdge10標(biāo)準(zhǔn)版、DeepEdge10Max和DeepEdge200四款芯片,提供算力范圍覆蓋8T至256T,可滿足從小型邊緣設(shè)備到智算中心高性能計(jì)算的需求。
2025年初,云天勵(lì)飛提供部署DeepSeek-R1全尺寸模型的大模型訓(xùn)推一體機(jī)。
經(jīng)過11年發(fā)展,云天勵(lì)飛已經(jīng)推出五代NPU(神經(jīng)網(wǎng)絡(luò)芯片),并推出產(chǎn)品矩陣。
其中,DeepEdge10芯片平臺(tái)已成功適配DeepSeek系列模型、QwQ-32B模型及國(guó)產(chǎn)鴻蒙操作系統(tǒng),可為客戶提供全國(guó)產(chǎn)的軟硬一體化產(chǎn)品和解決方案?;谧匝蠥I推理芯片,云天勵(lì)飛聯(lián)合生態(tài)合作伙伴推出面向云、邊、端的AI推理產(chǎn)品系列,包括模組、邊緣智能盒子、AI推理加速卡、大模型推理一體機(jī),以及智算服務(wù)器等。
組件:天星、天書、天棧、天芯;
SoC:深界(芯片)、深穹(計(jì)算卡)、深擎(一體機(jī))
設(shè)備和集群:深界D、深穹R、深穹Cube
其他AI產(chǎn)品:嚕咔博士、岍丞等。
隨著AI熱潮興起,云天勵(lì)飛業(yè)績(jī)持續(xù)向好。財(cái)報(bào)顯示,2024年,云天勵(lì)飛營(yíng)業(yè)收入超9億元,同比增長(zhǎng)81.3%。截至2025年第一季度,公司營(yíng)收2.64億元,同比大增168.23%,創(chuàng)歷史同期新高。
今年上半年,云天勵(lì)飛公司與德元方惠簽署的約4000PFLOPS的AI訓(xùn)練及推理異構(gòu)算力服務(wù)協(xié)議(預(yù)計(jì)未來3年貢獻(xiàn)約16億營(yíng)收)已于2025年4月完成全部驗(yàn)收工作并開始回款,預(yù)計(jì)上半年將貢獻(xiàn)約2億元營(yíng)收;天府智算中心項(xiàng)目收益層面,公司已完成天府智算中心的交付,并于2024年第四季度確認(rèn)相關(guān)收入。
消費(fèi)級(jí)業(yè)務(wù)方面,2024年,云天勵(lì)飛消費(fèi)級(jí)場(chǎng)景業(yè)務(wù)通過岍丞技術(shù)的智能穿戴設(shè)備(已進(jìn)入華為、榮耀、OPPO等供應(yīng)鏈)和嚕咔博士的AI硬件產(chǎn)品線,預(yù)計(jì)2025年上半年消費(fèi)級(jí)業(yè)務(wù)將保持50%以上增速。
如今,研發(fā)11年NPU之后,云天勵(lì)飛再進(jìn)一步,全面發(fā)力大模型推理算力,發(fā)布針對(duì)于推理算力的AI芯片以及算力卡,布局一體機(jī)、智算中心等方案,產(chǎn)品將廣泛應(yīng)用于智算中心、智慧城市和具身智能等領(lǐng)域。
對(duì)于為何從邊緣AI計(jì)算戰(zhàn)略,轉(zhuǎn)變?yōu)锳I模型推理算力,陳寧表示,美國(guó)絕大部分90%以上的科技發(fā)明停留在實(shí)驗(yàn)室里面,但對(duì)于中國(guó),AI推理芯片則是推動(dòng)AI產(chǎn)業(yè)大規(guī)模落地的關(guān)鍵領(lǐng)域和關(guān)鍵技術(shù),中國(guó)一定要把握新機(jī)遇。
他提到,未來五年,大模型、算法和推理芯片為核心的AI技術(shù)將重新定義人類所有的電子產(chǎn)品;未來五到十年,以推理芯片為核心的AI算力網(wǎng)絡(luò)會(huì)無處不在。
“這種戰(zhàn)略轉(zhuǎn)變?cè)从贏I產(chǎn)業(yè)的發(fā)展:2014至2022年小模型時(shí)代,需開發(fā)邊緣AI芯片解決細(xì)分場(chǎng)景問題,形成‘行業(yè)+AI’模式;2022年11月后,大模型重塑格局,推動(dòng)AI+行業(yè),催生消費(fèi)類與企業(yè)級(jí)新賽道,產(chǎn)業(yè)進(jìn)入行業(yè)AI、企業(yè)AI、消費(fèi)者AI并行階段。我們持續(xù)跟蹤技術(shù),2023年推出兼容大模型部署的‘算力積木’,快速升級(jí)戰(zhàn)略聚焦AI推理芯片,經(jīng)過兩年多儲(chǔ)備,今年正式提出打造該領(lǐng)域領(lǐng)軍企業(yè)的核心戰(zhàn)略?!?/p>
“中國(guó)和歐美之間最大的差異,在于我們(中國(guó))擁有人口的紅利,擁有更加豐富的應(yīng)用場(chǎng)景,這樣一個(gè)背景之下,云天勵(lì)飛是2014年我?guī)ьI(lǐng)一支海歸技術(shù)團(tuán)隊(duì)回到深圳創(chuàng)立了一家中國(guó)的AI推理芯片企業(yè)。如今,我們打造了一條應(yīng)用生產(chǎn)數(shù)據(jù),數(shù)據(jù)訓(xùn)練算法,算法定義芯片,芯片規(guī)?;瘧?yīng)用的數(shù)據(jù)飛輪,通過應(yīng)用數(shù)據(jù)算法芯片這樣一個(gè)數(shù)據(jù)飛輪,依托中國(guó)豐富的應(yīng)用場(chǎng)景,不斷推動(dòng)著AI算法和大算力推理芯片技術(shù)發(fā)展動(dòng)力。我們堅(jiān)信,云天勵(lì)飛會(huì)進(jìn)一步加大在AI推理芯片領(lǐng)域的研發(fā)和投入,抓住這樣一個(gè)市場(chǎng)的機(jī)遇,尤其未來五年AI智能體應(yīng)用的爆發(fā),帶來國(guó)產(chǎn)AI推理芯片和算力市場(chǎng)機(jī)遇,推動(dòng)中國(guó)搶占第四次工業(yè)革命的第一張入場(chǎng)券。”陳寧稱。
具體來說,相比其他算力卡,云天勵(lì)飛深穹X6000Mesh加速卡有以下核心技術(shù)特點(diǎn):
一、其采用自研第四代神經(jīng)網(wǎng)絡(luò)處理器(NPU),高效支持Transformer架構(gòu),主要應(yīng)用于模型推理環(huán)境;
二、Edge芯片采用國(guó)產(chǎn)工藝制造,Edge10C、Edge10、Edge10Max已通過自主可控國(guó)產(chǎn)化C級(jí)認(rèn)證,板級(jí)方案通過100%國(guó)產(chǎn)化率驗(yàn)證;
三、這是國(guó)內(nèi)首顆量產(chǎn)的基于國(guó)產(chǎn)先進(jìn)工藝的“算力積木”架構(gòu)(D2DChiplet和C2CMesh)的AI芯片。所謂D2DChiplet是指Die裸片之間的互聯(lián),而C2CMesh互聯(lián)是兩個(gè)Chip芯片之間的通訊互聯(lián),從而實(shí)現(xiàn)片間算力擴(kuò)展,滿足千億級(jí)大模型部署需求。
陳寧對(duì)筆者表示,目前基于深穹X6000Mesh推理加速卡的推理一體機(jī)正逐步量產(chǎn)落地。另外,云天勵(lì)飛在智算中心中也有布局?!爸撬阒行臅?huì)有四類客戶:城市級(jí)參與的智算中心建設(shè),科研院所對(duì)國(guó)產(chǎn)芯片需求,運(yùn)營(yíng)商以及互聯(lián)網(wǎng)大廠,他們都在各地建設(shè)智算中心,這里面我們都有布局。”
陳寧強(qiáng)調(diào),DeepSeek一體機(jī)的本質(zhì)在于,打破各個(gè)行業(yè)最后一公里的AI應(yīng)用閉環(huán)。如今熱潮消退,并不一定代表一體機(jī)的“退場(chǎng)”,而是大家理性思考如何把一體機(jī)真正做到應(yīng)用閉環(huán)。他認(rèn)為,未來很長(zhǎng)一段時(shí)間,一體機(jī)和云端推理集群將并行發(fā)展。
AI算力需求每年增超80%,云天下一代AI芯片2026年推出
2025年,隨著DeepSeek等開源模型大幅降低企業(yè)使用門檻,推理算力成本不斷降低,以及從智能客服到自動(dòng)駕駛的AI應(yīng)用快速擴(kuò)展,推理算力需求也不斷增長(zhǎng)。
今年6月,AMDCEO蘇姿豐(LisaSu)表示,去年AMD預(yù)測(cè),到2028年,全球數(shù)據(jù)中心AI加速芯片規(guī)模達(dá)到5000億美元,年增長(zhǎng)速度超過60%。而如今隨著推理模型的興起,這個(gè)數(shù)字甚至更高。
蘇姿豐稱,未來幾年,AI推理算力需求預(yù)計(jì)將每年增長(zhǎng)超過80%,有望超過訓(xùn)練成為數(shù)據(jù)中心計(jì)算的主要驅(qū)動(dòng)力。
顯然,AI推理算力需求正加速增長(zhǎng)。
陳寧也同意這一觀點(diǎn)。他認(rèn)為,AI訓(xùn)練是一個(gè)確定性市場(chǎng),英偉達(dá)已經(jīng)定義這一市場(chǎng),但推理方面,云天勵(lì)飛從創(chuàng)業(yè)之初堅(jiān)定不移定義AI推理,最近兩年很多企業(yè)正在從訓(xùn)練市場(chǎng)逐步轉(zhuǎn)型到訓(xùn)推一體的市場(chǎng),探索未來推理成長(zhǎng)空間,但這一過程中,“我們認(rèn)為云天勵(lì)飛有些差異化競(jìng)爭(zhēng)力”。
針對(duì)于下一代“算力積木”架構(gòu)和AI推理芯片進(jìn)展,云天勵(lì)飛CTO李愛軍透露有五個(gè)方面的重要升級(jí):
1、采用新型計(jì)算。第五代NPUNova500,支持原生態(tài)FP8/FP4,專用大模型算子,計(jì)算效率提升5倍,能效比提升3倍以上。
2、近存計(jì)算。采用3DMemoryHybridBonding(內(nèi)存混合鍵合技術(shù)),帶來10倍內(nèi)存帶寬提升、10倍訪存能效比提升。
3、采用NB-Mesh新型互聯(lián)。支持超節(jié)點(diǎn)內(nèi)縱向算力擴(kuò)展(scaleup),支持多維FullMesh互聯(lián),直接內(nèi)存語義訪問,以及數(shù)據(jù)傳輸allreduce(全局歸約)。
4、新型封裝。包括采用異質(zhì)多Die封裝、UCIED2DChiplet等技術(shù)。
5、NB-Link通用擴(kuò)展性。支持PCIe通用接口界面,CPU/NPU大互聯(lián)帶寬,支持CPU/NPU直接內(nèi)存訪問,可以加速AIAgent智能體響應(yīng)速度。
李愛軍表示,第二代“算力積木”通過上述五個(gè)創(chuàng)新,打造新型大模型推理計(jì)算平臺(tái),滿足嵌入式物聯(lián)網(wǎng)、邊緣端、云推理對(duì)邊緣大模型、MoE大模型的極致推理效率、能效比、性價(jià)比需求。
據(jù)悉,基于第二代“算力積木”架構(gòu)的云天勵(lì)飛下一代AI推理芯片,預(yù)計(jì)將于2026年底陸續(xù)推出,包括深界、深擎、深穹三個(gè)系列將分別推出相應(yīng)的產(chǎn)品;到2028年,云天勵(lì)飛會(huì)推出第三代“算力積木”。
對(duì)于下半年業(yè)績(jī)預(yù)期和國(guó)產(chǎn)芯片發(fā)展,陳寧表示,基于AI推理算法、算力和AI應(yīng)用需求增長(zhǎng),公司相信會(huì)繼續(xù)保持一個(gè)高速增長(zhǎng)趨勢(shì)。同時(shí),云天勵(lì)飛用五年的時(shí)間迎接機(jī)遇和挑戰(zhàn),如今已實(shí)現(xiàn)全面國(guó)產(chǎn)芯片的商用量產(chǎn)。
陳寧表示,作為一家國(guó)產(chǎn)AI芯片公司,確實(shí)是面臨著巨大的挑戰(zhàn),主要是起步晚、生態(tài)不完善、國(guó)際復(fù)雜環(huán)境等一系列挑戰(zhàn),但很多機(jī)遇其實(shí)都是在挑戰(zhàn)之下的。云天勵(lì)飛一直在做基于矩陣類的并行計(jì)算芯片,團(tuán)隊(duì)有這樣一個(gè)基因、決心和信念,可以克服各種挑戰(zhàn)。同時(shí),云天勵(lì)飛持續(xù)擁抱國(guó)產(chǎn)工藝,擁有市場(chǎng)差異化競(jìng)爭(zhēng)優(yōu)勢(shì)。
來源:紅網(wǎng)
作者:李宜希
編輯:王虹玉
本文為紅辣椒評(píng)論 原創(chuàng)文章,僅系作者個(gè)人觀點(diǎn),不代表紅網(wǎng)立場(chǎng)。轉(zhuǎn)載請(qǐng)附原文出處鏈接和本聲明。