智東西作者|程茜編輯|漠影
智東西7月25日?qǐng)?bào)道,在世界人工智能大會(huì)正式開(kāi)幕前一天,階躍星辰在發(fā)布會(huì)上接連放出一系列重磅消息。
首先,階躍發(fā)布新一代主力基座模型Step3,并宣布將于7月31日面向全球企業(yè)和開(kāi)發(fā)者開(kāi)源,為開(kāi)源世界貢獻(xiàn)最強(qiáng)多模態(tài)推理模型。Step3的野心是打造推理時(shí)代最適合應(yīng)用的模型,實(shí)現(xiàn)了行業(yè)領(lǐng)先的推理解碼效率。它在國(guó)產(chǎn)芯片上的推理效率最高可達(dá)DeepSeek-R1的300%,且對(duì)所有芯片友好。
這也引出了第二個(gè)重磅,階躍宣布聯(lián)合近10家芯片及基礎(chǔ)設(shè)施廠商,共同發(fā)起“模芯生態(tài)創(chuàng)新聯(lián)盟”,致力于通過(guò)底層聯(lián)合創(chuàng)新提升大模型適配性和算力效率,加速大模型應(yīng)用落地,包括華為昇騰、沐曦、壁仞科技、燧原科技、天數(shù)智芯、無(wú)問(wèn)芯穹在內(nèi)的多家頂級(jí)國(guó)產(chǎn)芯片大佬罕見(jiàn)地在階躍發(fā)布會(huì)同臺(tái)亮相。
與基礎(chǔ)大模型能力進(jìn)階同頻的,是階躍星辰在大模型商業(yè)化應(yīng)用落地上勢(shì)如破竹——根據(jù)官方披露的數(shù)據(jù),2025年上半年,階躍星辰的收入快速增長(zhǎng),全年收入預(yù)計(jì)接近10億元。
階躍星辰創(chuàng)始人、CEO姜大昕談道,隨著大模型進(jìn)入到強(qiáng)化學(xué)習(xí)發(fā)展階段,新一代推理模型成為主流,模型性能的提升固然顯著,但這是否完全等同于模型價(jià)值?什么樣的推理模型是最適合商業(yè)化應(yīng)用的?如何聯(lián)動(dòng)模型、芯片、基礎(chǔ)設(shè)施全技術(shù)鏈條的力量,一起加速大模型的應(yīng)用落地?基礎(chǔ)大模型公司如何通過(guò)技術(shù)創(chuàng)新找到健康可持續(xù)的商業(yè)化路徑?
階躍在這場(chǎng)發(fā)布會(huì)對(duì)這一系列問(wèn)題交出了有行業(yè)啟發(fā)性的答卷。
一、多榜單超主流開(kāi)源模型,推理效率可達(dá)DeepSeek-R1300%
推理模型已然成為今年大模型產(chǎn)業(yè)的熱詞。
但當(dāng)下推理模型的可用性仍被多重現(xiàn)實(shí)瓶頸制約:能支撐其流暢運(yùn)行的高性能芯片供給有限,多數(shù)企業(yè)面臨模型跑得起卻用不起的算力困境;開(kāi)源生態(tài)的不完善讓技術(shù)迭代受限,閉源模式下用戶既難驗(yàn)證推理邏輯的可靠性,也難以針對(duì)場(chǎng)景深度調(diào)優(yōu);更關(guān)鍵的是,大量推理模型仍困于單一模態(tài)的“信息孤島”,缺乏兼具文本、圖像、視頻、語(yǔ)音的綜合多模態(tài)能力,難以應(yīng)對(duì)真實(shí)世界的復(fù)雜交互需求。
但如今能同時(shí)處理文本、圖像、音頻、視頻、傳感器數(shù)據(jù)等多種模態(tài)信息,并進(jìn)行跨模態(tài)理解與推理的多模態(tài)推理模型,其重要性正隨著技術(shù)發(fā)展和應(yīng)用深化愈發(fā)凸顯。
這一背景下,階躍星辰新一代多模態(tài)推理旗艦?zāi)P蚐tep3應(yīng)運(yùn)而生。Step3是階躍星辰首個(gè)全尺寸、原生多模態(tài)推理模型,兼顧模型效果與推理成本,是在模型架構(gòu)創(chuàng)新、算法工程協(xié)同設(shè)計(jì)上的一次大膽嘗試與ScaleUp。Step3采用MoE架構(gòu),總參數(shù)量321B,激活參數(shù)量38B。
在現(xiàn)場(chǎng),Step3模型通過(guò)我們常見(jiàn)的色盲測(cè)試接受了感知能力考驗(yàn),模型準(zhǔn)確識(shí)別出了圖形中隱藏的“STEP3”,并且還在推理過(guò)程中提到“它知道自己也叫Step3,這可能是一個(gè)有趣的巧合”。
▲色盲測(cè)試
下一個(gè)難題面臨的場(chǎng)景更為復(fù)雜。一份包含多人在微信群里有討論購(gòu)買(mǎi)零食和酒水的聊天記錄,還有一份購(gòu)買(mǎi)的小票,Step3需要結(jié)合小票和聊天記錄,最后算出群里的成員如何分賬。Step3就可以快速理清如何分賬,將視覺(jué)和推理能力相結(jié)合,最后算出每個(gè)人要出的總價(jià)格。
與人工計(jì)算結(jié)果相比,Step3的答案僅有0.03元差異,是由于四舍五入的規(guī)則不同導(dǎo)致的。
▲微信分賬
推理時(shí)代讓模型可用的先決條件擴(kuò)展到了多模態(tài)、夠聰明。
Step3作為多模態(tài)推理模型,具備視覺(jué)感知和復(fù)雜推理能力,可完成跨領(lǐng)域的復(fù)雜只是理解、數(shù)學(xué)與視覺(jué)信息的交叉分析、日常生活中的各類(lèi)視覺(jué)分析問(wèn)題等。
在智能方面,Step3擁有強(qiáng)大的視覺(jué)感知和復(fù)雜推理能力,可準(zhǔn)確完成跨領(lǐng)域的復(fù)雜知識(shí)理解、數(shù)學(xué)與視覺(jué)信息的交叉分析,以及日常生活中的各類(lèi)視覺(jué)分析問(wèn)題。Step3在MMMU、MathVision、SimpleVQA、AIME25、LiveCodeBench(2024.08-2025.05)等榜單上取得了開(kāi)源多模態(tài)推理模型的SOTA成績(jī)。
此外,Step3還有兩大亮點(diǎn)優(yōu)勢(shì):開(kāi)源和成本效益高。開(kāi)源毫無(wú)疑問(wèn)可以幫助契合和開(kāi)發(fā)者降低使用門(mén)檻,并加速模型迭代。而成本效益高則是考驗(yàn)著對(duì)模型性能與成本巧妙平衡。
根據(jù)原理分析,Step3在國(guó)產(chǎn)芯片上的推理效率最高可達(dá)DeepSeek-R1的300%,且對(duì)所有芯片友好,在基于NVIDIAHopper架構(gòu)的芯片進(jìn)行分布式推理時(shí),相較DeepSeek-R1的吞吐量提升超70%。
值得注意的是,這一實(shí)測(cè)結(jié)果都是在不犧牲模型激活參數(shù)量、不降低注意力容量的條件下實(shí)現(xiàn)的。
隨著大模型技術(shù)邁向推理時(shí)代,階躍星辰給出了,最適合實(shí)際應(yīng)用的大模型需要滿足強(qiáng)智能、低成本、可開(kāi)源和多模態(tài)四個(gè)特征。這四個(gè)維度缺一不可,因?yàn)閱吸c(diǎn)能力強(qiáng),無(wú)法滿足用戶對(duì)于模型的綜合需求。唯有模型全面發(fā)展,才能讓模型真正用起來(lái)。
以Step3為代表的多模態(tài)推理模型正推動(dòng)單一模態(tài)大模型向類(lèi)人認(rèn)知能力的方向進(jìn)化,從而使得AI能在更為復(fù)雜的場(chǎng)景落地。
作為“多模態(tài)卷王”階躍星辰在當(dāng)下大模型應(yīng)用爆發(fā)節(jié)點(diǎn)交出的最新答卷,它的設(shè)計(jì)理念使其走向規(guī)?;瘧?yīng)用成為可能。
究其根源,是階躍星辰在多模態(tài)模型賽道的不斷深耕。階躍星辰成立兩年多以來(lái),已經(jīng)構(gòu)建起“1+N”的Step系列大模型矩陣,共發(fā)布23款模型?!?”是指Step3基礎(chǔ)大模型,“N”則為Step系列的多模態(tài)大模型矩陣,廣泛覆蓋語(yǔ)音、視覺(jué)理解、圖像編輯、圖像和視頻生成、音樂(lè)等領(lǐng)域,其模型已經(jīng)多次在LMSYS、OpenCompass、MATH-Vision等國(guó)內(nèi)外權(quán)威基準(zhǔn)測(cè)試榜上位列中國(guó)大模型第一。
二、聯(lián)動(dòng)頭部芯片天團(tuán),組建模芯創(chuàng)新生態(tài)聯(lián)盟
與此同時(shí),多模態(tài)推理模型在實(shí)際場(chǎng)景中對(duì)應(yīng)用適配性的嚴(yán)苛要求,進(jìn)一步強(qiáng)化了其與芯片深度適配的必要性。
在此基礎(chǔ)上,階躍星辰將Step3模型對(duì)幾乎所有芯片進(jìn)行了適配,在設(shè)計(jì)Step3模型架構(gòu)的時(shí)候,就已經(jīng)考慮了國(guó)產(chǎn)芯片的硬件特點(diǎn)。
其采用的策略是“內(nèi)外聯(lián)動(dòng)”,即對(duì)內(nèi)通過(guò)系統(tǒng)技術(shù)創(chuàng)新來(lái)降低模型推理成本、發(fā)力開(kāi)源,對(duì)外則深度聯(lián)動(dòng)芯片企業(yè)和基礎(chǔ)設(shè)施廠商,形成全技術(shù)鏈條協(xié)同的底層創(chuàng)新模式。
多模態(tài)推理模型需要處理圖像、音頻、視頻、點(diǎn)云等多種異構(gòu)數(shù)據(jù),這些數(shù)據(jù)的存儲(chǔ)格式、處理流程、計(jì)算強(qiáng)度差異極大,對(duì)芯片的算力結(jié)構(gòu)、內(nèi)存帶寬、硬件加速單元等提出了遠(yuǎn)超單一模態(tài)的挑戰(zhàn)。
而沒(méi)有針對(duì)性適配的芯片,多模態(tài)推理模型要么因算力不足無(wú)法落地,要么因效率太低難以商業(yè)化。
當(dāng)下降低大模型的推理成本,已經(jīng)成為決定大模型應(yīng)用滲透率的關(guān)鍵課題,其本質(zhì)就是提升算力的應(yīng)用效率。因此,從一定程度上看,芯片適配是多模態(tài)推理模型走向商業(yè)化落地的核心前提。
今日,階躍星辰聯(lián)合華為昇騰、沐曦、壁仞科技、燧原科技、天數(shù)智芯、無(wú)問(wèn)芯穹、寒武紀(jì)、摩爾線程、硅基流動(dòng)等近10家芯片、基礎(chǔ)設(shè)施廠商發(fā)起成立“模芯創(chuàng)新生態(tài)聯(lián)盟”,打通芯片、模型和平臺(tái)全鏈路技術(shù)。
目前,華為昇騰芯片已率先實(shí)現(xiàn)Step3的搭載和運(yùn)行,沐曦、天數(shù)智芯和燧原已初步實(shí)現(xiàn)運(yùn)行Step3。其它聯(lián)盟廠商的適配工作正在開(kāi)展。
模型與芯片企業(yè)的聯(lián)動(dòng)最直觀的優(yōu)勢(shì)就是,可以提升模型性能和效率,模型與硬件深度適配可以在降低資源消耗的同時(shí)充分發(fā)揮模型性能,而這種協(xié)同研發(fā)的新模式,正是模型、芯片互相驅(qū)動(dòng)升級(jí)形成正向循環(huán)的必然結(jié)果。
從更長(zhǎng)遠(yuǎn)的角度看,這可以降低成本推動(dòng)規(guī)?;虡I(yè)落地,成為打破推理模型成本居高不下桎梏的一條有效路徑。
三、多模態(tài)能力觸達(dá)多元智能終端,階躍星辰全年?duì)I收沖刺10億
在研發(fā)思路中致力于讓大模型真正可用的階躍星辰,在商業(yè)化應(yīng)用落地上也突飛猛進(jìn)。
2025年上半年,階躍星辰的收入快速增長(zhǎng),全年收入沖刺10億元。
這是階躍星辰將大模型能力深度融入手機(jī)、汽車(chē)以及各類(lèi)IoT設(shè)備和當(dāng)下被稱(chēng)為制造業(yè)皇冠明珠的人形機(jī)器人的階段性成效,貫穿新興產(chǎn)業(yè)與已擁有海量用戶基礎(chǔ)的賽道。
在智能終端Agent應(yīng)用側(cè),階躍星辰開(kāi)放平臺(tái)數(shù)據(jù)顯示,其上半年來(lái)自智能終端的多模態(tài)模型調(diào)用次數(shù)和調(diào)用量,環(huán)比增長(zhǎng)均超800%。
具體在手機(jī)方面,階躍星辰已經(jīng)和超半數(shù)頭部國(guó)產(chǎn)手機(jī)廠商達(dá)成合作,多模態(tài)能力落地榮耀、OPPO等品牌的旗艦機(jī)型;汽車(chē)層面,階躍聯(lián)合吉利推出AI智能座艙,成功實(shí)現(xiàn)行業(yè)內(nèi)端到端語(yǔ)音大模型首次量產(chǎn)上車(chē);面向IoT終端,階躍星辰通過(guò)生態(tài)開(kāi)放的方式,與包括TCL在內(nèi)的一系列IoT平臺(tái)和設(shè)備廠商緊密協(xié)作,推動(dòng)設(shè)備間的智能化升級(jí)和體驗(yàn)的無(wú)縫連接。
除了直接在不同終端落地的Agent,階躍星辰還亮出了垂類(lèi)Agent以適配用戶更為細(xì)分的應(yīng)用場(chǎng)景。階躍AI作為階躍星辰基于自研模型能力打造的智能助手,具備文本、圖像、語(yǔ)音等多模態(tài)交互能力和推理能力,可以在科研場(chǎng)景幫助用戶核查信息、視覺(jué)理解生成、視頻通話等。
Agent被認(rèn)為是大模型的下一個(gè)焦點(diǎn),其既是大模型目前應(yīng)用落地的絕佳載體之一,同時(shí)是企業(yè)探索AGI的主要路徑。從階躍星辰的布局可以看出,其已經(jīng)將多模態(tài)大模型的能力內(nèi)化到千行百業(yè),在各類(lèi)智能終端設(shè)備上落地。
在這樣的全棧布局下,階躍星辰在基礎(chǔ)模型、智能終端Agent、垂類(lèi)Agent領(lǐng)域三管齊下,成為大模型應(yīng)用落地率先沖出的一家創(chuàng)企。其半年時(shí)間落地應(yīng)用成果已遍地開(kāi)發(fā),不僅催生出眾多實(shí)際落地的智能終端設(shè)備,更構(gòu)建起健康協(xié)同的商業(yè)模式,形成了良性發(fā)展生態(tài)。
結(jié)語(yǔ):大模型商業(yè)化落地競(jìng)速開(kāi)啟
隨著大模型發(fā)展邁入下半場(chǎng),行業(yè)競(jìng)爭(zhēng)的焦點(diǎn)已從基座模型的性能比拼,深度延伸至商業(yè)化落地的速度與質(zhì)量,階躍星辰已然趟出一條商業(yè)化與模型研發(fā)共進(jìn)的路徑。
階躍超級(jí)模型+超級(jí)應(yīng)用戰(zhàn)略的雙輪驅(qū)動(dòng),使其在大模型下半場(chǎng)的競(jìng)爭(zhēng)中占據(jù)了獨(dú)特優(yōu)勢(shì),模型研發(fā)為商業(yè)化提供能用、好用的技術(shù)底座,商業(yè)化落地為模型迭代注入源源不斷的場(chǎng)景數(shù)據(jù)與需求靈感,二者協(xié)同勾勒出大模型從技術(shù)創(chuàng)新到產(chǎn)業(yè)價(jià)值轉(zhuǎn)化的清晰路徑。
跌宕起伏的爆文《愛(ài)上惡魔少爺》,讀完真的相信愛(ài)情了!
人氣好文《愛(ài)上惡魔少爺》滿屏好評(píng)的細(xì)節(jié),快推薦給朋友們
等你來(lái)看!甜度超高的寵文《愛(ài)上惡魔少爺》,開(kāi)頭就是甜寵
免責(zé)聲明:本文內(nèi)容由開(kāi)放的智能模型自動(dòng)生成,僅供參考。