P1-13電影版你體內(nèi)明明關(guān)押著幾百頭兇獸,卻始終無法覺醒獸魂之力成為御獸師
P1-13電影版你體內(nèi)明明關(guān)押著幾百頭兇獸,卻始終無法覺醒獸魂之力成為御獸師
“在上海隨便喝蜜雪冰城,故鄉(xiāng)會保護(hù)你?!?/a>
階躍星辰CEO姜大昕
7月26日消息,2025年世界人工智能(WAIC)大會暨人工智能全球治理高級別會議今天在上海啟幕。
本屆WAIC以“智能時代同球共濟(jì)”為主題,來自30余個國家和地區(qū)的1200余位嘉賓齊聚滬上,其中包括12位圖靈獎、諾貝爾獎等頂獎得主,80余位中外院士,以及多個國際頂尖實(shí)驗(yàn)室代表;展廳方面,展覽面積首次突破7萬平方米,吸引800余家企業(yè)參展,集中發(fā)布3000余項(xiàng)前沿展品,包括40余款大模型、50余款A(yù)I終端產(chǎn)品、60余款智能機(jī)器人及100余款“全球首發(fā)”或“中國首秀”新品。
WAIC大會前一天,上海AI大模型頭部公司階躍星辰發(fā)布新一代基礎(chǔ)大模型——Step3,是公司首個全尺寸、原生多模態(tài)推理模型,采用MoE架構(gòu),總參數(shù)量321B(3210億),激活參數(shù)量380億。其中包括階躍首個多模理解生成一體化模型Step3oVision,第二代端到端語音大模型Step-Audio2。
同時,Step3兼顧模型效果與推理成本,擁有強(qiáng)大視覺感知和復(fù)雜推理能力,可準(zhǔn)確完成跨領(lǐng)域的復(fù)雜知識理解、數(shù)學(xué)與視覺信息的交叉分析,以及日常生活中的各類視覺分析問題,并在MMMU等多個榜單上取得了開源多模態(tài)推理模型的SOTA成績。
此外,算力優(yōu)化層面,階躍星辰重點(diǎn)發(fā)力國產(chǎn)芯片推理,Step3系列在國產(chǎn)芯片上的推理效率最高可達(dá)DeepSeek-R1的300%,推理輸出理論成本低于MiniMaxM1、KimiK2等最新模型;而在基于英偉達(dá)Hopper架構(gòu)芯片進(jìn)行分布式推理時,實(shí)測Step3相較于DeepSeek-R1的吞吐量提升超70%。據(jù)悉,Step3將于7月31日面向全球企業(yè)和開發(fā)者開源,目前Step3已授權(quán)國內(nèi)多家芯片公司,并完成了芯片適配。
會上,階躍星辰CEO姜大昕還宣布,上海國投生態(tài)體系將在近期參與投資階躍星辰的最新一輪融資,以及階躍星辰今年的收入沖刺目標(biāo)定為10億元人民幣。據(jù)悉,本輪階躍星辰總?cè)谫Y額預(yù)計(jì)超過5億美元(約合35.77億元),或創(chuàng)2025年AI大模型行業(yè)單輪融資最高。
姜大昕會后對筆者表示,大模型走到今天已經(jīng)從GPT范式的1.0走到了強(qiáng)化學(xué)習(xí)范式下的2.0,當(dāng)前堅(jiān)持訓(xùn)練模型的公司正在變少,“每個行業(yè)節(jié)點(diǎn)都會有公司掉隊(duì)?!?/p>
姜大昕指出,大模型商業(yè)化和AGI技術(shù)目標(biāo)是相互牽引的關(guān)系。AGI本身就是要打造模型能力,而應(yīng)用是給了模型的實(shí)際場景,甚至說是AI應(yīng)用牽引著AI模型。階躍星辰一直堅(jiān)持“超級模型+超級應(yīng)用”,兩者關(guān)系非常緊密,一方面模型能力會決定應(yīng)用上限,另一方面,應(yīng)用也給了模型提供具體場景和數(shù)據(jù),兩者并不存在選擇問題。
階躍星辰副總裁李璟進(jìn)一步向筆者解釋稱,一直以來,階躍星辰在商業(yè)化打法和策略上有非常多的獨(dú)特性,公司成立之初就意識到,偏定制化、純賣API這兩種商業(yè)模式不是特別可持續(xù),尤其大廠能“賣云送模型”,所以他認(rèn)為,大模型API的商業(yè)化注定是大廠的生意邏輯。
李璟指出,如今階躍星辰的商業(yè)化非常聚焦,非常擅長去2B2C、ToC兩個方向打造一些產(chǎn)品級收入,包括超50%頭部國產(chǎn)手機(jī)品牌已接入階躍多模態(tài)能力,以及擁有金融、汽車領(lǐng)域的客戶。李璟指出,上半年階躍星辰收入合同收入規(guī)模已有數(shù)億元,確認(rèn)收入和毛利水平都表現(xiàn)較好,全年10億元這一目標(biāo)是確認(rèn)性收入,而非訂單性收入,今年全年有望完成10億收入目標(biāo)。
據(jù)悉,階躍星辰成立于2023年4月,是行業(yè)領(lǐng)先的通用大模型創(chuàng)業(yè)公司。成立兩年多,階躍星辰已構(gòu)建起“1+N”的Step系列大模型矩陣,“1”是指Step3基礎(chǔ)大模型;“N”則為Step系列的多模態(tài)大模型矩陣,已累計(jì)發(fā)布超過20多款自研基座模型,覆蓋文字、語音、圖像、視頻、音樂、推理等全系列、覆蓋語音、視覺理解、圖像等領(lǐng)域。
姜大昕向筆者確認(rèn),在組織架構(gòu)中,視頻生成團(tuán)隊(duì)全面轉(zhuǎn)向在“多模理解生成一體化”技術(shù)組里面。而“多模理解生成一體化”是當(dāng)前階躍星辰建立世界模型的最佳路徑之一,從而往智能涌現(xiàn)、AIAgent和通用人工智能(AGI)方向發(fā)展。
此外,階躍星辰宣布聯(lián)合壁仞科技、燧原科技、無問芯穹、摩爾線程、沐曦股份、寒武紀(jì)、華為昇騰等近10家芯片及基礎(chǔ)設(shè)施廠商,共同發(fā)起“模芯生態(tài)創(chuàng)新聯(lián)盟”,致力于打通芯片、模型和平臺全鏈路技術(shù)。
目前,華為昇騰芯片已首先實(shí)現(xiàn)Step3的搭載和運(yùn)行。沐曦、天數(shù)智芯和燧原科技等也已初步實(shí)現(xiàn)運(yùn)行Step3。
階躍星辰聯(lián)合創(chuàng)始人兼副總裁朱亦博表示,他表示,模型每推理一個token所訪問的顯存和進(jìn)行的計(jì)算量,與其注意力機(jī)制有關(guān)。團(tuán)隊(duì)考慮到行業(yè)當(dāng)前在英偉達(dá)H800和H20等芯片所受到的限制,Step3在架構(gòu)設(shè)計(jì)層面重點(diǎn)考量了國產(chǎn)芯片的計(jì)算特性,在訪存比(計(jì)算量/訪存量)斜率上優(yōu)先貼近國產(chǎn)芯片,使其運(yùn)行過程中不會出現(xiàn)嚴(yán)重的計(jì)算瓶頸或顯存瓶頸。
朱亦博進(jìn)一步稱,這種聯(lián)盟并非做算力型的“壟斷”?,F(xiàn)在階躍星辰算力層面的第一目標(biāo),是能夠在推理側(cè)不依賴英偉達(dá),但團(tuán)隊(duì)并沒有刻意要“排斥”任何一種芯片,主要因?yàn)榇竽P桶l(fā)展既是一個商業(yè)問題也是一種科學(xué)問題,那么在當(dāng)前條件下,團(tuán)隊(duì)首先面對的是在模型智能層面“咬住”美國最尖端模型,不要被拉得太遠(yuǎn)。至于模型用什么樣的芯片,也是根據(jù)現(xiàn)有的條件做出被動選擇,而非階躍的主觀選擇。
姜大昕坦言,實(shí)事求是講,整個大模型領(lǐng)域我們看到的還是中國在追美國這樣一個趨勢,這是資源有限情況下比較有效或比較“聰明”的策略。所以,中國其實(shí)是在“追趕”美國的頂尖模型,但追趕的過程中也是一個創(chuàng)新的過程。
值得一提的是,7月25日會議上,沐曦創(chuàng)始人、董事長兼總經(jīng)理陳維良,天數(shù)智芯董事長兼CEO蓋魯江,燧原科技創(chuàng)始人、董事長兼CEO趙立東和壁仞科技創(chuàng)始人、董事長兼CEO張文四位國產(chǎn)AI芯片CEO首度罕見同臺,這些企業(yè)被媒體稱為“上海英偉達(dá)”。千里科技董事長印奇擔(dān)任主持。
一上臺,印奇就拋出一個問題:“大家能不能用一句話,總結(jié)一下最近六個月的狀態(tài)?”
對此,陳維良表示,內(nèi)外環(huán)境復(fù)雜,做芯片不容易,所以上半年很忙很累,但是很充實(shí)。
蓋魯江稱,上半年波瀾壯闊,期待下半年大有所為。
趙立東則表示,模型和國產(chǎn)芯片“雙向奔赴”是我們未來實(shí)現(xiàn)國產(chǎn)AI生態(tài)最重要的部分,“我們看到了希望,下半年加油”。
張文稱,上半年的話我們經(jīng)歷了各種各樣國際上的壓力,我們幾家扛過來了,祝賀各位,也期待未來發(fā)展更好。
對于大模型是否用好,張文進(jìn)一步表示,毫無疑問,中國大模型應(yīng)用已經(jīng)“沒問題”了?!癘penAI去年就提出了五級AGI路線圖,它的分級與自動駕駛非常類似,也有L1-L5的不同階段。終極的AGI就如同L5自動駕駛,將會實(shí)現(xiàn)無人化,也就是徹底取代人來處理各種復(fù)雜任務(wù)。我們目前的大模型,包括DeepSeek,處在L2,也就是Reasoner(推理AI)的水平。”
趙立東表示,大模型使用的核心在于“推理”,最早從美國ChatGPT開始,中國起步較晚,今年春節(jié)DeepSeekR1讓大家在生活中能夠方便地使用大模型的推理,從而開始普及。另外,基于開源的大模型進(jìn)行二次、三次開發(fā)的時候,將會有更多針對行業(yè),針對應(yīng)用場景的蒸餾版出現(xiàn)。今天階躍星辰發(fā)布Step3,一方面針對國產(chǎn)卡,另外一方面強(qiáng)調(diào)開源,這會極大推動模型的落地。
“講到痛點(diǎn),芯片企業(yè)的痛點(diǎn)我不多說,牽扯到很復(fù)雜的國際背景,但我很高興聽到,剛才發(fā)布當(dāng)中一再強(qiáng)調(diào)的降低成本,這是非常重要的。無論模型也好,還是芯片也好,如果想長期、可持續(xù)性發(fā)展,就要實(shí)現(xiàn)從技術(shù)產(chǎn)品的閉環(huán)到商業(yè)化閉環(huán),換句話說要降低成本要賺錢,不然就不可持續(xù)。所以在這一點(diǎn)上,恰恰是我們未來的目標(biāo),以及我們需要加強(qiáng)協(xié)作來實(shí)現(xiàn)更高性價比,更好的效率或者商業(yè)利益?!壁w立東稱。
對于國產(chǎn)算力發(fā)展,趙立東表示,國產(chǎn)AI芯片一直有兩座大山:一是高端芯片制造,另外一個就是生態(tài)。
趙立東指出,特別是高性能推理,AI芯片公司最大機(jī)遇就是大模型和芯片如何深度優(yōu)化,經(jīng)過幾年磨合,燧原產(chǎn)品的性價比是可以做到兩倍到三倍,對標(biāo)英偉達(dá)(NV)的芯片,同時價格上、成本上也有一定優(yōu)勢,性價比需要持續(xù)提升。“對推理來講,你要落地,如果實(shí)現(xiàn)不了商業(yè)化的利益,換句話說,不能盈利,這個事兒不可長久、不可持續(xù),所以我們一直強(qiáng)調(diào)算力普惠。”
張文強(qiáng)調(diào),國產(chǎn)大模型對國產(chǎn)芯片的發(fā)展特別重要,因?yàn)閲鴥?nèi)大模型的水平和國外差不多,但國產(chǎn)芯片(和英偉達(dá)的)差距還是比較大的,設(shè)計(jì)芯片是挺痛苦的事。從開始設(shè)計(jì)到做出來是兩年以后的事情,所以一定要有前瞻性,才能把芯片設(shè)計(jì)好。而適配國產(chǎn)大模型公司對芯片公司的產(chǎn)品定義有非常大的幫助,根據(jù)他們的需求,包括針對大模型的超長文本、MoE架構(gòu)、多模態(tài)、大規(guī)模推理等特性,從而對產(chǎn)品做一個調(diào)整。
“所以從某種意義上,國內(nèi)大模型的發(fā)展?fàn)縿又鴩鴥?nèi)芯片設(shè)計(jì)的發(fā)展?!睆埼姆Q。
(本文首發(fā)于鈦媒體App,作者|林志佳,編輯|蓋虹達(dá))
長期不說話,邏輯混亂,沒有觀點(diǎn),每天循環(huán)一個動作
南京鋼琴教師堅(jiān)持演播有聲書,9年收獲260萬粉絲8.7億播放
如何在孩子們腦海種下“說話有方”的種子?讀漫畫版《鬼谷子》