東深
7月28日,2025年世界人工智能大會期間,2025無問芯穹智能算力生態(tài)論壇在滬舉行。論壇上,無問芯穹聯(lián)合創(chuàng)始人、CEO夏立雪發(fā)布了無問芯穹全規(guī)模AI效能躍升方案,并正式推出三大核心產(chǎn)品:無穹AI云、無界智算平臺與無垠終端智能。
該方案是一套面向未來智能基礎(chǔ)設(shè)施的軟硬協(xié)同系統(tǒng),為跨地域智算網(wǎng)絡(luò)、智算集群與多形態(tài)智能終端等全規(guī)模場景,統(tǒng)一適配多種異構(gòu)算力,提供從模型調(diào)度、性能優(yōu)化到應(yīng)用部署的全鏈路支持。
發(fā)布會現(xiàn)場,夏立雪將這三個產(chǎn)品比作了“三個盒子”,他表示,無問芯穹希望通過提供“打包式”的產(chǎn)品服務(wù)能力,在單卡至十萬卡算力的全規(guī)模軟硬件場景中,讓每一份算力,都能釋放最大的智慧潛能。
夏立雪指出,從傳統(tǒng)算法到AI1.0、AI2.0階段,計算資源持續(xù)驅(qū)動著智能邊界的拓展,逼近AGI的臨界點。然而,有一條人類文明的終極邊界始終橫亙在AGI之路上——資源的有限性。
為解決有限資源與無限需求之間的矛盾,無問芯穹提出加速抵達AGI臨界點的兩條進路——提高智能效率、擴充計算資源。一方面突破從計算資源到智能性的轉(zhuǎn)化效率,用更少的計算資源獲取更強的智能;另一方面,不斷挖掘和喚醒更多的可用計算資源,而這兩條路徑的交匯之處,即是新的AGI臨界點所在。
“兩年前,我們驚艷于幾千卡集群訓(xùn)練而成的GPT3.5,但今天,一部手機也可以裝下與它同等性能的小型AI了?!毕牧⒀┲赋?,資源的稀缺性約束驅(qū)動著智能效率的持續(xù)進化,而廣泛的應(yīng)用需求,也正牽引著頂尖模型不斷從大規(guī)模計算中下放到中等算力、小算力場景中。
夏立雪繪制了一個AI應(yīng)用落地的價值空間:人工智能應(yīng)用落地價值空間=場景尺度×計算資源×智能效率。他表示:“無問芯穹始終致力于以場景尺度、計算資源與智能效率的共振,以有限的資源實現(xiàn)無限的需求,抵達‘智無邊際、算無虛發(fā)’的終極愿景,讓有計算的地方,就有‘無穹’的智能涌現(xiàn)?!?/p>
具體來看,被稱為“大盒子”的“無穹AI云”為超大規(guī)模算力集群的利用提供了一個系統(tǒng)性的解決方案,將全局的異構(gòu)、異域、異屬的算力匯聚成一張“智能感知、實時發(fā)現(xiàn)、隨需獲取”云端算力網(wǎng)絡(luò),不僅連得起來,還調(diào)得出來、調(diào)得過去、調(diào)得準(zhǔn)。
無穹AI云的底層是一張深度覆蓋全國的廣域算力網(wǎng),基于無問芯穹“一網(wǎng)三異”調(diào)度架構(gòu),目前已成功覆蓋“東數(shù)西算”國家戰(zhàn)略布局的關(guān)鍵節(jié)點,匯聚了來自26個省市、53個核心數(shù)據(jù)中心的算力資源,整合超15種主流芯片架構(gòu)的異構(gòu)算力池,總算力規(guī)模超25000P。企業(yè)能夠按需在不同地域、不同型號的算力資源之間進行實時切換與無縫遷移。據(jù)悉,無問芯穹服務(wù)的全球最大人工智能孵化器——上海模速空間,日均Token調(diào)用量已成功突破100億大關(guān),累計服務(wù)10余個智慧場景、支撐100多個前沿AI創(chuàng)新應(yīng)用,單應(yīng)用月活高達數(shù)千萬。
發(fā)布會現(xiàn)場,華為昇騰910B加速卡正式上線由無問芯穹與模速空間聯(lián)合運營的全國首個“算力生態(tài)超市”——模速空間算力生態(tài)平臺。模速空間算力生態(tài)平臺2.0同步發(fā)布。
“無界智算平臺”被稱為“中盒子”。夏立雪表示:“目前,無界智算平臺已在超過100個大型研發(fā)場景中多次成功保障了大規(guī)模模型訓(xùn)練與推理任務(wù)的關(guān)鍵需求,并幫助國產(chǎn)計算集群實現(xiàn)了實實在在的正向收益。”
在無問芯穹與上海算法創(chuàng)新研究院的合作中,無界智算平臺以“全鏈路解決方案”升級服務(wù),幫助上海算創(chuàng)院實現(xiàn)大模型研發(fā)效率的飛躍。平臺成功基于3000卡沐曦國產(chǎn)GPU集群,穩(wěn)定支撐百億參數(shù)大模型訓(xùn)練長達600小時不間斷,創(chuàng)造了國產(chǎn)算力模型訓(xùn)練的記錄。
“無垠終端智能”解決方案被稱為“小盒子”。在“小盒子”里,無垠終端智能致力于以軟硬協(xié)同核心技術(shù)優(yōu)勢,打造“端模型+端引擎+端硬件”智能終端一體化解決方案,突破終端設(shè)備的物理資源限制,實現(xiàn)極致的算力優(yōu)化和利用。
在終端模型方面,無問芯穹宣布攜手上海創(chuàng)智院共同打造了全球首款端側(cè)本征模型無穹天權(quán)Infini-Megrez2.0,在實現(xiàn)云級21B參數(shù)智能水平的同時,將內(nèi)存占用控制在7B規(guī)模、實際計算量控制在3B規(guī)模,可以適配當(dāng)下的各類終端設(shè)備,打破了終端“能效-空間-智能”的不可能三角,突破了終端設(shè)備的資源局限。
發(fā)布會現(xiàn)場,Infini-Megrez2.0的研發(fā)團隊進行的演示顯示,用戶在電腦合蓋之前給出語音指令“整理今日會議記錄”。電腦合蓋后,系統(tǒng)自動調(diào)度閑置CPU周期執(zhí)行后臺任務(wù),等任務(wù)完成后,則自動釋放內(nèi)存并轉(zhuǎn)入待機。喚醒設(shè)備時,整理好的會議紀(jì)要已完整呈現(xiàn)在電腦上,算力亦能瞬時恢復(fù)滿血狀態(tài),并且全程無聯(lián)網(wǎng)、無發(fā)熱。這意味著,即使AIPC操作者合蓋休眠電腦,進入離線的移動辦公環(huán)境,大模型依然可以接力穩(wěn)定完成任務(wù)。算下來,單臺設(shè)備年均可釋放1000多小時的生產(chǎn)力,真正實現(xiàn)了“手停腦停,AI不停”。
無穹天權(quán)Infini-Megrez2.0推理速度突破,依托于無問芯穹“端模型+端引擎+端硬件”三位一體協(xié)同優(yōu)化體系。繼上半年與聯(lián)想合作發(fā)布聯(lián)想智能終端推理加速引擎后,無問芯穹7月28日發(fā)布了更強大的繼任者——無穹開陽Infini-Mizar2.0。據(jù)了解,Mizar2.0和Megrez2.0強強聯(lián)合能更進一步地實現(xiàn)推理速度的飆升和顯存、功耗的極致壓縮,在相同資源占用情況下,實現(xiàn)智能水平提升18%、推理性能提升超100%。夏立雪說:“如果說Mizar2.0推理引擎是成功實現(xiàn)了把大象放進冰箱,那么再疊加上我們的端模型Megrez2.0,則是實現(xiàn)了讓大象在冰箱里跳舞?!?/p>
基于Mizar2.0的重大升級,無問芯穹發(fā)布了與新華三合作的大模型一體機,為用戶提供開機即用的一體化軟硬件整合方案。同時,無問芯穹與蘇州異格技術(shù)深度合作,推出FPGA大模型推理一體機,單機即可驅(qū)動百億參數(shù)大模型,且在能效翻倍的基礎(chǔ)上,進一步大幅降低大模型推理成本。
來源:紅網(wǎng)
作者:俟文漪
編輯:暢飛蘭
本文為紅辣椒評論 原創(chuàng)文章,僅系作者個人觀點,不代表紅網(wǎng)立場。轉(zhuǎn)載請附原文出處鏈接和本聲明。