經濟觀察報記者錢玉娟
在2025世界人工智能大會(下稱“WAIC2025”)開幕前夜,7月25日,中國人工智能科技企業(yè)上海階躍星辰智能科技有限公司(下稱“階躍星辰”)發(fā)布了首個全尺寸、原生多模態(tài)推理模型Step3,這一基座大模型將于7月31日面向全球企業(yè)和開發(fā)者開源。
階躍星辰創(chuàng)始人、CEO姜大昕接受包括經濟觀察報在內的媒體采訪時稱,當下堅持做基礎大模型的公司越來越少,困難在于投入巨大。特別是當大模型產業(yè)過渡至2.0時代后,不少公司會放棄模型訓練,去追求商業(yè)化。而他認為,模型的能力會決定應用的上限,應用也會給模型提供具體的場景、數(shù)據(jù),因此,階躍星辰更堅持超級模型加超級應用的路徑。
姜大昕認為,最適合實際應用的大模型需要滿足強智能、低成本、可開源和多模態(tài)四個特征,缺一不可。唯有模型全面發(fā)展,才能讓模型真正用起來。這也是階躍星辰研發(fā)Step3基礎模型的出發(fā)點:為追求性能與成本極致均衡的企業(yè)和開發(fā)者設計。
姜大昕介紹,Step3是在模型架構創(chuàng)新、算法工程協(xié)同設計上的一次大膽嘗試與ScaleUp(縱向擴展、提升)。該基座大模型采用MoE架構,總參數(shù)量321B(3210億),激活參數(shù)量38B(380億),卻可以在較高的推理解碼效率下實現(xiàn)關鍵的成本優(yōu)化過程。
Step3擁有視覺感知和復雜推理能力,既能準確完成跨領域的復雜知識理解、數(shù)學與視覺信息的交叉分析,還能解決日常生活中的各類視覺分析問題。
階躍星辰聯(lián)合創(chuàng)始人兼副總裁朱亦博對Step3的表現(xiàn)進行技術解釋,在不犧牲激活參數(shù)量、不降低注意力容量的條件下,實測Step3在英偉達H800芯片上進行分布式推理時,相較于行業(yè)頂尖水平的模型DeepSeek-R1的吞吐量提升了超70%,而在國產芯片上的推理效率最高能達DeepSeek-R1的300%。
階躍星辰與近10家芯片及基礎設施廠商組建一個模芯生態(tài)創(chuàng)新聯(lián)盟,旨在通過聯(lián)合打通芯片、模型和平臺全鏈路的底層技術,提升大模型適配性和算力效率。
記者在現(xiàn)場看到,華為昇騰、沐曦、壁仞科技、燧原科技、天數(shù)智芯、無問芯穹、寒武紀、摩爾線程、硅基流動等廠商已成為上述聯(lián)盟的首批成員。其中,華為昇騰芯片首先實現(xiàn)Step3的搭載和運行;沐曦、天數(shù)智芯和燧原科技等也初步實現(xiàn)運行Step3。
燧原科技創(chuàng)始人、董事長兼CEO趙立東一直認為國產AI芯片廠商面前有兩座大山,一是高端芯片制造,二是生態(tài)。模型和芯片合作正是在解決生態(tài)的問題。
趙立東將階躍星辰的Step3視為一款專門為國產芯片卡開發(fā)的大模型,在他看來,芯片軟件開發(fā)人員與應用或模型開發(fā)人員深度合作,開發(fā)出的國產芯片產品的性能優(yōu)化和性價比等,不單是要對標英偉達的芯片,更關鍵的是要實現(xiàn)低成本、高性能,用國產算力支撐國產大模型的長遠發(fā)展目標。
除了與產業(yè)上下游多廠商成立聯(lián)盟共建生態(tài),階躍星辰還宣布與上海國有資本投資有限公司戰(zhàn)略合作,在獲得上海國投生態(tài)體系的一輪新融資后,階躍星辰計劃向全年10億元人民幣的收入目標沖刺。
階躍星辰聯(lián)合創(chuàng)始人、副總裁李璟負責商業(yè)化,他在接受包括經濟觀察報在內的媒體采訪時明確,上述收入指確認的合同收入,該目標建立在階躍星辰2025年上半年已實現(xiàn)數(shù)億元合同收入且毛利水平較高的基礎上。
李璟未給出營收業(yè)務各項及比例的具體數(shù)據(jù),但他表示,在目前布局的手機、汽車、IoT設備等關鍵應用場景中,階躍星辰已經與國內超一半的手機廠商合作打造Agent(智能體),也有吉利這樣的頭部車廠在共建智能座艙等,還在金融、零售等多個垂直領域與相關頭部企業(yè)探索面向C端的場景化應用。
(作者錢玉娟)
免責聲明:本文觀點僅代表作者本人,供參考、交流,不構成任何建議。
錢玉娟
TMT新聞部記者長期關注并報道TMT領域的重大事件,時刻保持新聞敏感,發(fā)現(xiàn)前沿趨勢。擅長企業(yè)模式、人物專訪及行業(yè)深度報道。重要新聞線索可聯(lián)系qianyujuan@eeo.com.cn微信號:EstherQ138279