無(wú)問(wèn)芯穹聯(lián)合創(chuàng)始人、CEO夏立雪
7月30日消息,2025世界人工智能大會(huì)(WAIC2025)期間,清華系A(chǔ)Iinfra公司無(wú)問(wèn)芯穹發(fā)布全規(guī)模AI效能躍升方案,并正式推出三大核心產(chǎn)品:無(wú)穹AI云、無(wú)界智算平臺(tái)與無(wú)垠終端智能。
具體來(lái)說(shuō),無(wú)穹AI云主要針對(duì)萬(wàn)卡至十萬(wàn)卡全局算力網(wǎng)絡(luò),無(wú)界智算平臺(tái)則是針對(duì)百卡至千卡級(jí)大型智算集群,無(wú)垠終端智能針對(duì)單卡至十卡級(jí)有限算力終端。該方案是一套面向未來(lái)智能基礎(chǔ)設(shè)施的軟硬協(xié)同系統(tǒng),分為跨地域智算網(wǎng)絡(luò)、智算集群與多形態(tài)智能終端等全規(guī)模場(chǎng)景,統(tǒng)一適配多種異構(gòu)算力,提供從模型調(diào)度、性能優(yōu)化到應(yīng)用部署的全鏈路支持。
與此同時(shí),7月29日凌晨無(wú)問(wèn)芯穹還宣布,無(wú)穹AI云大模型服務(wù)平臺(tái)現(xiàn)已上線(xiàn)智譜最新開(kāi)源、性能達(dá)全球第三的新一代旗艦?zāi)P蜕霞蹽LM-4.5(3550億參數(shù))和GLM-4.5-air(1060億)。
事實(shí)上,隨著DeepSeek全球爆火,KimiK2、MiniMaxM1、智譜GLM-4.5等開(kāi)源模型均在北京時(shí)間夜間發(fā)布,希望以此在海外獲得好評(píng),而AIInfra算力公司都在第一時(shí)間適配。這讓我們對(duì)于模型、算力、芯片之間的融合性發(fā)展抱有更多的期待。
無(wú)問(wèn)芯穹聯(lián)合創(chuàng)始人兼CEO夏立雪表示,通過(guò)提供無(wú)穹AI云、無(wú)界智算平臺(tái)與無(wú)垠終端智能,在單卡至十萬(wàn)卡算力的全規(guī)模軟硬件場(chǎng)景中賦能AI應(yīng)用。
夏立雪指出,當(dāng)前國(guó)內(nèi)芯片與算力設(shè)施種類(lèi)繁多,形成了多個(gè)獨(dú)立生態(tài),但不同廠商的硬件架構(gòu)、接口協(xié)議差異顯著,導(dǎo)致開(kāi)發(fā)者往往需要花費(fèi)大量精力學(xué)習(xí)不同芯片的使用方法,這嚴(yán)重制約了AI技術(shù)的落地效率。而無(wú)問(wèn)芯穹打造了一套產(chǎn)業(yè)鏈上的“世界通用語(yǔ)言”,可實(shí)現(xiàn)不同芯片之間的無(wú)縫通信與協(xié)同,從而使算力資源即插即用,且如同超市商品般可自由挑選。
夏立雪對(duì)筆者稱(chēng),模型和算力芯片是兩條驅(qū)動(dòng)路徑。模型本身是技術(shù)驅(qū)動(dòng),而芯片是模型的資源,所以,兩者不可能分開(kāi)發(fā)展,還是需要一定的融合及協(xié)同。技術(shù)上,infra公司肯定做很多優(yōu)化手段,再把現(xiàn)在能用的資源整合起來(lái),盡可能不要被資源限制,而從更長(zhǎng)遠(yuǎn)的發(fā)展來(lái)說(shuō),國(guó)內(nèi)算力產(chǎn)業(yè)還是需要多方配合。這是整個(gè)產(chǎn)業(yè)要一起解決的問(wèn)題。
“這很難用一個(gè)統(tǒng)一的確定性方式來(lái)描述,為什么?因?yàn)槲覀儑?guó)內(nèi)整個(gè)生態(tài)非常豐富,而看國(guó)外,你說(shuō)到底是英偉達(dá)先造出芯片,還是OpenAI先造出模型,對(duì)吧。如果他們兩個(gè)是閉環(huán)的,英偉達(dá)就永遠(yuǎn)知道它的下一個(gè)芯片該怎么造,模型廠商知道未來(lái)有可能用上什么樣的芯片,所以,生態(tài)閉環(huán)是非常重要的,我們希望能夠打造國(guó)內(nèi)的算力生態(tài)。芯片迭代確實(shí)慢,一顆芯片從設(shè)計(jì)到流片,再到測(cè)試,至少兩年。但是如果我們能夠把生態(tài)信息,和資源閉環(huán)打通,我們的芯片廠商就能夠知道下面應(yīng)該往哪個(gè)方向發(fā)展,包括讓內(nèi)存變大、訪存變得更快,做一個(gè)新的計(jì)算單元等。”夏立雪表示。
據(jù)悉,無(wú)問(wèn)芯穹成立于2023年5月,是一家專(zhuān)注于為AI2.0時(shí)代提供完整解決方案的科技公司,致力于成為大模型落地過(guò)程中的"M×N"中間層,為中國(guó)乃至全球AI產(chǎn)業(yè)的發(fā)展注入新的動(dòng)力。
“兩年前,我們驚艷于幾千卡集群訓(xùn)練而成的GPT3.5,但今天,一部手機(jī)也可以裝下與它同等性能的小型AI了。”夏立雪指出,資源的稀缺性約束驅(qū)動(dòng)著智能效率的持續(xù)進(jìn)化,而廣泛的應(yīng)用需求,也正牽引著頂尖模型不斷從大規(guī)模計(jì)算中下放到中等算力、小算力場(chǎng)景中。他繪制了一個(gè)AI落地價(jià)值圖:AI應(yīng)用落地價(jià)值空間=場(chǎng)景尺度×計(jì)算資源×智能效率。
2024年,無(wú)問(wèn)芯穹宣布完成近5億元A輪融資,創(chuàng)下國(guó)內(nèi)AI基礎(chǔ)設(shè)施最大單筆融資記錄。至此,這家僅僅成立兩年的公司已累計(jì)“吸金”超過(guò)10億元。
官網(wǎng)顯示,目前無(wú)問(wèn)芯穹主要提供兩類(lèi)核心產(chǎn)品或服務(wù):一是AI云平臺(tái),面向企業(yè)和開(kāi)發(fā)者提供從算力、模型到應(yīng)用的一站式服務(wù),包括全面的云管平臺(tái)、強(qiáng)大的基礎(chǔ)云產(chǎn)品、一站式AI開(kāi)發(fā)平臺(tái)、大模型開(kāi)發(fā)平臺(tái)、大模型應(yīng)用開(kāi)發(fā)平臺(tái)、行業(yè)大模型方案等;二是云平臺(tái)之下的國(guó)產(chǎn)化AI算力適配和性能極致優(yōu)化,對(duì)十余種國(guó)產(chǎn)AI芯片全面適配,實(shí)現(xiàn)開(kāi)源模型的無(wú)縫遷移,通過(guò)算法和編譯優(yōu)化,國(guó)產(chǎn)芯片性能提升50%~200%,并實(shí)現(xiàn)多源異構(gòu)國(guó)產(chǎn)AI芯片的統(tǒng)一調(diào)度和混合精度計(jì)算,綜合性?xún)r(jià)比全面超越國(guó)際主流芯片。
整體來(lái)看,無(wú)問(wèn)芯穹的產(chǎn)品體系從基礎(chǔ)設(shè)施到行業(yè)應(yīng)用,包括面向智算中心、大模型廠商、行業(yè)客戶(hù)等領(lǐng)域,全面助力AGI技術(shù)的規(guī)?;涞?。
據(jù)夏立雪在現(xiàn)場(chǎng)披露的數(shù)據(jù)顯示,無(wú)問(wèn)芯穹服務(wù)的全球最大AI孵化器——上海模速空間,日均Tokens調(diào)用量已成功突破100億大關(guān),累計(jì)服務(wù)10余個(gè)智慧場(chǎng)景、支撐100多個(gè)前沿AI創(chuàng)新應(yīng)用,單應(yīng)用月活高達(dá)數(shù)千萬(wàn)。
如今,無(wú)問(wèn)芯穹進(jìn)一步細(xì)化相關(guān)產(chǎn)品服務(wù),夏立雪將這三個(gè)產(chǎn)品比作了“三個(gè)盒子”,提供“打包式”的產(chǎn)品服務(wù)能力。
夏立雪表示,無(wú)界智算平臺(tái)憑借其全域異構(gòu)兼容與智能調(diào)度能力,構(gòu)建了彈性靈活的算力服務(wù)能力,精準(zhǔn)匹配復(fù)雜業(yè)務(wù)需求,高效利用2000張華為昇騰910B智算加速卡,實(shí)現(xiàn)了千億參數(shù)模型的分布式部署與大規(guī)模推理。
同時(shí),無(wú)問(wèn)芯穹提供全球首個(gè)跨地域全分布式聯(lián)合強(qiáng)化學(xué)習(xí)服務(wù),將各地AIDC中零散的算力資源,與一個(gè)中等體量的算力集群結(jié)合起來(lái),完成跨地域的聯(lián)合強(qiáng)化學(xué)習(xí),最小支持單張消費(fèi)級(jí)顯卡接入,讓每一張閑置GPU都能發(fā)揮更大價(jià)值,讓中小企業(yè)也能訓(xùn)練自己的領(lǐng)域推理模型?;谶@一突破,無(wú)問(wèn)芯穹與三大運(yùn)營(yíng)商及20余家AIDC機(jī)構(gòu)聯(lián)合啟動(dòng)“AIDC聯(lián)合運(yùn)營(yíng)創(chuàng)新生態(tài)計(jì)劃”。
此外,無(wú)問(wèn)芯穹還提供各類(lèi)模型和一體機(jī)服務(wù)。例如,該公司與上海創(chuàng)智院共同打造了全球首款端側(cè)本征模型無(wú)穹天權(quán)Infini-Megrez2.0;無(wú)問(wèn)芯穹與聯(lián)想合作聯(lián)想智能終端推理加速引擎無(wú)穹開(kāi)陽(yáng)Infini-Mizar2.0,實(shí)現(xiàn)端側(cè)單任務(wù)異構(gòu)計(jì)算,在AIPC場(chǎng)景下將本地模型尺寸上限從70億提升到300億;無(wú)問(wèn)芯穹與新華三合作大模型一體機(jī);無(wú)問(wèn)芯穹與蘇州異格技術(shù)合作推出FPGA大模型推理一體機(jī)(是無(wú)問(wèn)自己的LPUIP),單機(jī)即可驅(qū)動(dòng)百億參數(shù)大模型,不僅能效翻倍,而且進(jìn)一步大幅降低大模型推理成本。
談到恢復(fù)銷(xiāo)售H20對(duì)于國(guó)產(chǎn)芯片發(fā)展話(huà)題,夏立雪表示,這依然需要看長(zhǎng)期價(jià)值。因?yàn)檫@也不是第一次出現(xiàn)沖擊(禁令)了,這種封禁再放開(kāi)的這種節(jié)奏發(fā)生很多次,所以整個(gè)產(chǎn)業(yè)對(duì)于這種變化也逐漸適應(yīng)。
“我會(huì)認(rèn)為,其實(shí)一切都在向好。我可以說(shuō),H20本身也不是在某一領(lǐng)域最尖端的技術(shù),無(wú)論是在訓(xùn)練還是在推理上,它都已經(jīng)是調(diào)優(yōu)過(guò)的版本了。所以,我認(rèn)為這一次至少對(duì)國(guó)內(nèi)產(chǎn)業(yè)來(lái)說(shuō),短期肯定會(huì)有波動(dòng),但長(zhǎng)期沒(méi)有那么大的沖擊?!毕牧⒀┓Q(chēng),大家一面做自己模型,另一面為國(guó)產(chǎn)芯片的使用不斷打磨,目前在一些國(guó)產(chǎn)卡上跑的比較快,具備了很好的商業(yè)價(jià)值,尤其AI逐漸從訓(xùn)練走向模型推理,最終看的是使用效率、性能等能否滿(mǎn)足需求。
夏立雪稱(chēng),雖然目前大部分訓(xùn)練是依靠英偉達(dá)卡,但推理側(cè)可以選擇很多國(guó)產(chǎn)計(jì)算卡?!昂芏嘤脩?hù)最開(kāi)始在我們平臺(tái)上使用國(guó)際先進(jìn)芯片,但我們會(huì)幫他們逐步遷移、擴(kuò)容到國(guó)產(chǎn)卡上,他們發(fā)現(xiàn)也很好用,這樣的話(huà)逐漸把國(guó)產(chǎn)GPU芯片使用起來(lái)?!?/p>
IEEEFellow,清華大學(xué)電子工程系教授、系主任,無(wú)問(wèn)芯穹發(fā)起人汪玉表示,如果要打通算力、數(shù)據(jù)、模型、應(yīng)用,至少得有那么一些人,多個(gè)領(lǐng)域都能懂。教育的背后其實(shí)還有很多垂直方向邏輯、水平方向的邏輯,不同層次的知識(shí)都有涉及,在技術(shù)公司做過(guò)、商業(yè)化團(tuán)隊(duì)做過(guò)應(yīng)用、對(duì)投資有一點(diǎn)點(diǎn)理解,這樣的人是更豐富的,更有希望做到能夠把“最后一公里”打通的人。這個(gè)世界不僅需要一些對(duì)某一個(gè)點(diǎn)特別著迷的人,還需要一類(lèi)人把全棧打通。因此,包括教育、科研等領(lǐng)域都應(yīng)該需要一起思考“最后一公里”的問(wèn)題。
夏立雪強(qiáng)調(diào),“無(wú)問(wèn)芯穹始終致力于以場(chǎng)景尺度、計(jì)算資源與智能效率的共振,以有限的資源實(shí)現(xiàn)無(wú)限的需求,抵達(dá)‘智無(wú)邊際、算無(wú)虛發(fā)’的終極愿景,讓有計(jì)算的地方,就有‘無(wú)穹’的智能涌現(xiàn)?!保ū疚氖装l(fā)于鈦媒體App,作者|林志佳,編輯|蓋虹達(dá))
延伸閱讀:與 2040《分鐘黃金》游:戲、時(shí)長(zhǎng)成開(kāi)發(fā)者制勝法寶 的相關(guān)文章