記者董溫淑
編輯高宇雷
7月25日,2025世界人工智能大會(WAIC2025)開幕前夕,大模型企業(yè)階躍星辰在上海正式發(fā)布其新一代基礎大模型——Step3。
官方信息顯示,作為階躍的主力基座模型,Step3兼顧智能與效率,旨在面向推理時代打造最適合應用的模型。
Step3將于7月31日面向全球企業(yè)和開發(fā)者開源,為開源世界貢獻最強多模態(tài)推理模型。同時,階躍星辰還宣布聯(lián)合多家國內(nèi)領先的芯片、平臺廠商發(fā)起成立“模芯生態(tài)創(chuàng)新聯(lián)盟”,將通過推動模型和芯片產(chǎn)業(yè)鏈聯(lián)合創(chuàng)新,加速大模型應用的落地。
此外,階躍星辰與上海國有資本投資有限公司達成深度戰(zhàn)略合作,將圍繞加強資本鏈接、生態(tài)業(yè)務合作等方面進行全面的深度合作。
階躍星辰創(chuàng)始人、CEO姜大昕稱,經(jīng)過此前對Step1、Step2兩代基模的快速迭代,階躍星辰意識到:“我們必須回歸客戶需求,立足真實應用場景,探索模型創(chuàng)新落地的可行路徑。這是我們研發(fā)新一代Step3基礎模型的出發(fā)點?!?/p>
Step3是階躍星辰首個全尺寸、原生多模態(tài)推理模型,兼顧模型效果與推理成本,是在模型架構創(chuàng)新、算法工程協(xié)同設計上的一次大膽嘗試與ScaleUp。Step3采用MoE架構,總參數(shù)量321B,激活參數(shù)量38B。
性能方面,Step3提升了視覺感知和復雜推理能力,可準確完成跨領域的復雜知識理解、數(shù)學與視覺信息的交叉分析,以及日常生活中的各類視覺分析問題。
在MMMU、MathVision、SimpleVQA、AIME2025、LiveCodeBench(2024.08-2025.05)等榜單上,Step3取得了開源多模態(tài)推理模型的SOTA成績。
而成本方面,Step3在國產(chǎn)芯片上的推理效率最高可達DeepSeek-R1的300%,且對所有芯片友好。在基于NVIDIAHopper架構的芯片進行分布式推理時,實測Step3相較于DeepSeek-R1的吞吐量提升超70%。并且,這是在不犧牲激活參數(shù)量、不降低注意力容量的條件下實現(xiàn)的。
目前,Step3已授權國內(nèi)多家芯片公司,其中華為昇騰芯片已首先實現(xiàn)Step3的搭載和運行;沐曦、天數(shù)智芯和燧原科技等也已初步實現(xiàn)運行Step3,另有其他廠商適配工作正在開展。
同時,Step3將于7月31日正式面向全球企業(yè)和開發(fā)者開源。
在發(fā)布環(huán)節(jié)之后,階躍星辰還宣布將聯(lián)合近10家芯片及基礎設施廠商,共同發(fā)起“模芯生態(tài)創(chuàng)新聯(lián)盟”,以打通芯片、模型和平臺全鏈路技術。該聯(lián)盟的首批成員包括華為昇騰、沐曦、壁仞科技、燧原科技、天數(shù)智芯、無問芯穹、寒武紀、摩爾線程、硅基流動等。
起點仙俠大神任我笑十部經(jīng)典小說,喜歡仙俠爽文的書友不要錯過!
五本游戲小說,《網(wǎng)游之絕學》習白,一個不學武就會死的男人
天龍網(wǎng)游八卦:“絕活哥”征服絕學副本,58.9萬評分登頂100層!
免責聲明:本文內(nèi)容由開放的智能模型自動生成,僅供參考。