刀白曼
無問芯穹聯(lián)合創(chuàng)始人、CEO夏立雪
7月30日消息,2025世界人工智能大會(WAIC2025)期間,清華系A(chǔ)Iinfra公司無問芯穹發(fā)布全規(guī)模AI效能躍升方案,并正式推出三大核心產(chǎn)品:無穹AI云、無界智算平臺與無垠終端智能。
具體來說,無穹AI云主要針對萬卡至十萬卡全局算力網(wǎng)絡(luò),無界智算平臺則是針對百卡至千卡級大型智算集群,無垠終端智能針對單卡至十卡級有限算力終端。該方案是一套面向未來智能基礎(chǔ)設(shè)施的軟硬協(xié)同系統(tǒng),分為跨地域智算網(wǎng)絡(luò)、智算集群與多形態(tài)智能終端等全規(guī)模場景,統(tǒng)一適配多種異構(gòu)算力,提供從模型調(diào)度、性能優(yōu)化到應(yīng)用部署的全鏈路支持。
與此同時,7月29日凌晨無問芯穹還宣布,無穹AI云大模型服務(wù)平臺現(xiàn)已上線智譜最新開源、性能達(dá)全球第三的新一代旗艦?zāi)P蜕霞蹽LM-4.5(3550億參數(shù))和GLM-4.5-air(1060億)。
事實(shí)上,隨著DeepSeek全球爆火,KimiK2、MiniMaxM1、智譜GLM-4.5等開源模型均在北京時間夜間發(fā)布,希望以此在海外獲得好評,而AIInfra算力公司都在第一時間適配。這讓我們對于模型、算力、芯片之間的融合性發(fā)展抱有更多的期待。
無問芯穹聯(lián)合創(chuàng)始人兼CEO夏立雪表示,通過提供無穹AI云、無界智算平臺與無垠終端智能,在單卡至十萬卡算力的全規(guī)模軟硬件場景中賦能AI應(yīng)用。
夏立雪指出,當(dāng)前國內(nèi)芯片與算力設(shè)施種類繁多,形成了多個獨(dú)立生態(tài),但不同廠商的硬件架構(gòu)、接口協(xié)議差異顯著,導(dǎo)致開發(fā)者往往需要花費(fèi)大量精力學(xué)習(xí)不同芯片的使用方法,這嚴(yán)重制約了AI技術(shù)的落地效率。而無問芯穹打造了一套產(chǎn)業(yè)鏈上的“世界通用語言”,可實(shí)現(xiàn)不同芯片之間的無縫通信與協(xié)同,從而使算力資源即插即用,且如同超市商品般可自由挑選。
夏立雪對筆者稱,模型和算力芯片是兩條驅(qū)動路徑。模型本身是技術(shù)驅(qū)動,而芯片是模型的資源,所以,兩者不可能分開發(fā)展,還是需要一定的融合及協(xié)同。技術(shù)上,infra公司肯定做很多優(yōu)化手段,再把現(xiàn)在能用的資源整合起來,盡可能不要被資源限制,而從更長遠(yuǎn)的發(fā)展來說,國內(nèi)算力產(chǎn)業(yè)還是需要多方配合。這是整個產(chǎn)業(yè)要一起解決的問題。
“這很難用一個統(tǒng)一的確定性方式來描述,為什么?因?yàn)槲覀儑鴥?nèi)整個生態(tài)非常豐富,而看國外,你說到底是英偉達(dá)先造出芯片,還是OpenAI先造出模型,對吧。如果他們兩個是閉環(huán)的,英偉達(dá)就永遠(yuǎn)知道它的下一個芯片該怎么造,模型廠商知道未來有可能用上什么樣的芯片,所以,生態(tài)閉環(huán)是非常重要的,我們希望能夠打造國內(nèi)的算力生態(tài)。芯片迭代確實(shí)慢,一顆芯片從設(shè)計到流片,再到測試,至少兩年。但是如果我們能夠把生態(tài)信息,和資源閉環(huán)打通,我們的芯片廠商就能夠知道下面應(yīng)該往哪個方向發(fā)展,包括讓內(nèi)存變大、訪存變得更快,做一個新的計算單元等。”夏立雪表示。
據(jù)悉,無問芯穹成立于2023年5月,是一家專注于為AI2.0時代提供完整解決方案的科技公司,致力于成為大模型落地過程中的"M×N"中間層,為中國乃至全球AI產(chǎn)業(yè)的發(fā)展注入新的動力。
“兩年前,我們驚艷于幾千卡集群訓(xùn)練而成的GPT3.5,但今天,一部手機(jī)也可以裝下與它同等性能的小型AI了?!毕牧⒀┲赋?,資源的稀缺性約束驅(qū)動著智能效率的持續(xù)進(jìn)化,而廣泛的應(yīng)用需求,也正牽引著頂尖模型不斷從大規(guī)模計算中下放到中等算力、小算力場景中。他繪制了一個AI落地價值圖:AI應(yīng)用落地價值空間=場景尺度×計算資源×智能效率。
2024年,無問芯穹宣布完成近5億元A輪融資,創(chuàng)下國內(nèi)AI基礎(chǔ)設(shè)施最大單筆融資記錄。至此,這家僅僅成立兩年的公司已累計“吸金”超過10億元。
官網(wǎng)顯示,目前無問芯穹主要提供兩類核心產(chǎn)品或服務(wù):一是AI云平臺,面向企業(yè)和開發(fā)者提供從算力、模型到應(yīng)用的一站式服務(wù),包括全面的云管平臺、強(qiáng)大的基礎(chǔ)云產(chǎn)品、一站式AI開發(fā)平臺、大模型開發(fā)平臺、大模型應(yīng)用開發(fā)平臺、行業(yè)大模型方案等;二是云平臺之下的國產(chǎn)化AI算力適配和性能極致優(yōu)化,對十余種國產(chǎn)AI芯片全面適配,實(shí)現(xiàn)開源模型的無縫遷移,通過算法和編譯優(yōu)化,國產(chǎn)芯片性能提升50%~200%,并實(shí)現(xiàn)多源異構(gòu)國產(chǎn)AI芯片的統(tǒng)一調(diào)度和混合精度計算,綜合性價比全面超越國際主流芯片。
整體來看,無問芯穹的產(chǎn)品體系從基礎(chǔ)設(shè)施到行業(yè)應(yīng)用,包括面向智算中心、大模型廠商、行業(yè)客戶等領(lǐng)域,全面助力AGI技術(shù)的規(guī)?;涞?。
據(jù)夏立雪在現(xiàn)場披露的數(shù)據(jù)顯示,無問芯穹服務(wù)的全球最大AI孵化器——上海模速空間,日均Tokens調(diào)用量已成功突破100億大關(guān),累計服務(wù)10余個智慧場景、支撐100多個前沿AI創(chuàng)新應(yīng)用,單應(yīng)用月活高達(dá)數(shù)千萬。
如今,無問芯穹進(jìn)一步細(xì)化相關(guān)產(chǎn)品服務(wù),夏立雪將這三個產(chǎn)品比作了“三個盒子”,提供“打包式”的產(chǎn)品服務(wù)能力。
夏立雪表示,無界智算平臺憑借其全域異構(gòu)兼容與智能調(diào)度能力,構(gòu)建了彈性靈活的算力服務(wù)能力,精準(zhǔn)匹配復(fù)雜業(yè)務(wù)需求,高效利用2000張華為昇騰910B智算加速卡,實(shí)現(xiàn)了千億參數(shù)模型的分布式部署與大規(guī)模推理。
同時,無問芯穹提供全球首個跨地域全分布式聯(lián)合強(qiáng)化學(xué)習(xí)服務(wù),將各地AIDC中零散的算力資源,與一個中等體量的算力集群結(jié)合起來,完成跨地域的聯(lián)合強(qiáng)化學(xué)習(xí),最小支持單張消費(fèi)級顯卡接入,讓每一張閑置GPU都能發(fā)揮更大價值,讓中小企業(yè)也能訓(xùn)練自己的領(lǐng)域推理模型?;谶@一突破,無問芯穹與三大運(yùn)營商及20余家AIDC機(jī)構(gòu)聯(lián)合啟動“AIDC聯(lián)合運(yùn)營創(chuàng)新生態(tài)計劃”。
此外,無問芯穹還提供各類模型和一體機(jī)服務(wù)。例如,該公司與上海創(chuàng)智院共同打造了全球首款端側(cè)本征模型無穹天權(quán)Infini-Megrez2.0;無問芯穹與聯(lián)想合作聯(lián)想智能終端推理加速引擎無穹開陽Infini-Mizar2.0,實(shí)現(xiàn)端側(cè)單任務(wù)異構(gòu)計算,在AIPC場景下將本地模型尺寸上限從70億提升到300億;無問芯穹與新華三合作大模型一體機(jī);無問芯穹與蘇州異格技術(shù)合作推出FPGA大模型推理一體機(jī)(是無問自己的LPUIP),單機(jī)即可驅(qū)動百億參數(shù)大模型,不僅能效翻倍,而且進(jìn)一步大幅降低大模型推理成本。
談到恢復(fù)銷售H20對于國產(chǎn)芯片發(fā)展話題,夏立雪表示,這依然需要看長期價值。因?yàn)檫@也不是第一次出現(xiàn)沖擊(禁令)了,這種封禁再放開的這種節(jié)奏發(fā)生很多次,所以整個產(chǎn)業(yè)對于這種變化也逐漸適應(yīng)。
“我會認(rèn)為,其實(shí)一切都在向好。我可以說,H20本身也不是在某一領(lǐng)域最尖端的技術(shù),無論是在訓(xùn)練還是在推理上,它都已經(jīng)是調(diào)優(yōu)過的版本了。所以,我認(rèn)為這一次至少對國內(nèi)產(chǎn)業(yè)來說,短期肯定會有波動,但長期沒有那么大的沖擊。”夏立雪稱,大家一面做自己模型,另一面為國產(chǎn)芯片的使用不斷打磨,目前在一些國產(chǎn)卡上跑的比較快,具備了很好的商業(yè)價值,尤其AI逐漸從訓(xùn)練走向模型推理,最終看的是使用效率、性能等能否滿足需求。
夏立雪稱,雖然目前大部分訓(xùn)練是依靠英偉達(dá)卡,但推理側(cè)可以選擇很多國產(chǎn)計算卡。“很多用戶最開始在我們平臺上使用國際先進(jìn)芯片,但我們會幫他們逐步遷移、擴(kuò)容到國產(chǎn)卡上,他們發(fā)現(xiàn)也很好用,這樣的話逐漸把國產(chǎn)GPU芯片使用起來?!?/p>
IEEEFellow,清華大學(xué)電子工程系教授、系主任,無問芯穹發(fā)起人汪玉表示,如果要打通算力、數(shù)據(jù)、模型、應(yīng)用,至少得有那么一些人,多個領(lǐng)域都能懂。教育的背后其實(shí)還有很多垂直方向邏輯、水平方向的邏輯,不同層次的知識都有涉及,在技術(shù)公司做過、商業(yè)化團(tuán)隊做過應(yīng)用、對投資有一點(diǎn)點(diǎn)理解,這樣的人是更豐富的,更有希望做到能夠把“最后一公里”打通的人。這個世界不僅需要一些對某一個點(diǎn)特別著迷的人,還需要一類人把全棧打通。因此,包括教育、科研等領(lǐng)域都應(yīng)該需要一起思考“最后一公里”的問題。
夏立雪強(qiáng)調(diào),“無問芯穹始終致力于以場景尺度、計算資源與智能效率的共振,以有限的資源實(shí)現(xiàn)無限的需求,抵達(dá)‘智無邊際、算無虛發(fā)’的終極愿景,讓有計算的地方,就有‘無穹’的智能涌現(xiàn)?!保ū疚氖装l(fā)于鈦媒體App,作者|林志佳,編輯|蓋虹達(dá))
方艙記憶:安徽支援湖北醫(yī)療隊員手繪漫畫記錄溫暖
1月23日武漢封城,1月25日同濟(jì)大學(xué)附屬東方醫(yī)院國家緊急醫(yī)學(xué)救援隊發(fā)出請戰(zhàn)書,2月7日武漢客廳方艙醫(yī)院接收第一名患者,3月8日勝利休艙等我繼續(xù)說。2020年這個不同尋常的春天,注定將被載入史冊,中國武漢,也因抗擊新型冠狀病毒肺炎的主戰(zhàn)場成為2020年開啟之時全世界關(guān)注的焦點(diǎn)。從“緊急搶建”到“休艙落幕”,35天武漢的等我繼續(xù)說。
《方艙記憶》:能握住的手堅決不放??中國日報網(wǎng)
5月12日下午,《方艙記憶》音頻專輯及同名紙質(zhì)書首發(fā)儀式在同濟(jì)大學(xué)附屬東方醫(yī)院舉行|。數(shù)十位抗疫一線親歷者實(shí)錄入書2020年初,新冠肺炎疫情暴發(fā),抗疫“主戰(zhàn)場”湖北牽動著全國人民的心-。包括上海在內(nèi)的各地醫(yī)療隊紛紛馳援湖北,醫(yī)護(hù)人員奔赴前線,為打贏這場沒有硝煙的戰(zhàn)爭作出了杰出貢獻(xiàn)|?!斗脚撚洃洝纷鳛槿笆秸鎸?shí)還有呢?
《方艙記憶》今天云首發(fā):這本書里有關(guān)于武漢方艙醫(yī)院最真實(shí)的記錄...
作為首部全景式真實(shí)記載武漢方艙醫(yī)院抗疫實(shí)情的紀(jì)實(shí)著作,由上??萍嘉墨I(xiàn)出版社出版的《方艙記憶》匯聚了患者、醫(yī)務(wù)人員、醫(yī)務(wù)人員家屬、志愿者等近60位普通人,在由同濟(jì)大學(xué)附屬東方醫(yī)院馳援武漢國家緊急醫(yī)學(xué)救援隊等十余支隊伍建立的武漢客廳方艙醫(yī)院的親身經(jīng)歷,以及他們記錄的手稿與拍攝的照片_。書中既能看到普通人在說完了。
來源:紅網(wǎng)
作者:劉家隆
編輯:李慈泉
本文為紅辣椒評論 原創(chuàng)文章,僅系作者個人觀點(diǎn),不代表紅網(wǎng)立場。轉(zhuǎn)載請附原文出處鏈接和本聲明。