在2025世界人工智能大會開幕之際,四位國產(chǎn)AI芯片大佬出現(xiàn)在階躍星辰Step3模型發(fā)布會的圓桌論壇上,沐曦創(chuàng)始人、董事長兼總經(jīng)理陳維良,天數(shù)智芯董事長兼CEO蓋魯江,燧原科技創(chuàng)始人、董事長兼CEO趙立東和壁仞科技創(chuàng)始人、董事長兼CEO張文首度罕見同臺,圍繞“大模型與芯片的協(xié)同創(chuàng)新和應(yīng)用落地”展開了對話,就國產(chǎn)大模型與AI芯片的協(xié)同痛點,以及如何讓中國的開源模型和AI芯片在推理大場景下有更好的爆發(fā)進(jìn)行了深層分析和前瞻研判。
大模型協(xié)同創(chuàng)新尚存重要痛點
盡管國內(nèi)大模型和AI芯片行業(yè)發(fā)展如火如荼,其中大模型已逐步推進(jìn)至應(yīng)用于各大領(lǐng)域,而AI芯片則取得不斷突破提升,但兩者之間的真正協(xié)同有待提高,尚存在一些痛點待解決。
上海天數(shù)智芯半導(dǎo)體股份有限公司董事長兼CEO蓋魯首先對國內(nèi)大模型產(chǎn)業(yè)的發(fā)展給予充分肯定。他表示,從芯片廠商來看,2025年從年初到現(xiàn)在,確實芯片在大模型應(yīng)用中的實際出貨量在快速增長。尤其是在一體機市場,從年初到現(xiàn)在已是快速發(fā)展和擴張的過程,其中核心原因是應(yīng)用開始快速發(fā)展,真正做到了芯片、模型助力場景應(yīng)用,而場景反饋回來的數(shù)據(jù)和信息又推動了大模型與芯片的進(jìn)一步迭代,從而形成了良性的正向循環(huán)。
“未來在大模型應(yīng)用過程中,芯片需要對場景針對性提升,以及根據(jù)應(yīng)用情況進(jìn)行具體迭代和改進(jìn)。這是一個非常確定性的方向?!彼f。
對于大模型應(yīng)用的痛點,上海壁仞科技股份有限公司創(chuàng)始人、董事長劍CEO張文稱,“從芯片端來看,首先是成本。伴隨著使用成本大幅上升,工程上迫切需要高性價比的方案降低大模型的推理成本,這可能需要與產(chǎn)業(yè)鏈合作伙伴共同努力。其次是供應(yīng)鏈。對國產(chǎn)AI芯片廠商而言,要想更好地服務(wù)于國產(chǎn)大模型,要確保充足的算力供應(yīng)。未來先進(jìn)AI芯片的產(chǎn)能對于國內(nèi)AI持續(xù)健康發(fā)展非常關(guān)鍵。而國內(nèi)芯片企業(yè)都有同樣的痛點,需要解決掉?!?/p>
他還指出,AI的三個要素,第一個數(shù)據(jù)、第二算法,第三算力。中國在數(shù)據(jù)、算法方面并不落后,但算力需要一些時間追趕,相信國產(chǎn)芯片有能力通過時間實現(xiàn)逐步追趕。
在上海燧原科技股份有限公司創(chuàng)始人、董事長CEO趙立東看來,大模型的真正落地是從今年春節(jié)開始,接下來會有另外一波更大規(guī)模的大模型推理落地,原因是基于開源的大模型進(jìn)行二次、三次開發(fā)的時候,將會有更多針對行業(yè)和應(yīng)用場景的蒸餾版出現(xiàn)。
至于這一進(jìn)程中的痛點,趙立東表示,“這牽扯到復(fù)雜的國際背景,但降低成本非常重要。無論是大模型還是AI芯片企業(yè),如果想長期、可持續(xù)性發(fā)展就要實現(xiàn)從技術(shù)產(chǎn)品到商業(yè)化閉環(huán),也就是既降低成本又能爭取盈利,同時需要加強協(xié)作來實現(xiàn)更高性價比,以更好的效率或者商業(yè)利益。而這也是我們未來的目標(biāo)?!?/p>
對此,沐曦集成電路(上海)股份有限公司創(chuàng)始人、董事長兼總經(jīng)理陳維良持有類似觀點。他表示,大模型的創(chuàng)新應(yīng)用和爆發(fā)有兩方面比較重要。首先是大模型的能力。如果大模型有很多事情做不了,就會被用戶放棄使用。其次就是使用成本。目前,很多先進(jìn)的技術(shù)既降低了成本又保持了能力,包括提升對多模態(tài)的處理能力。這對企業(yè)而言,能夠真正做到降本增效和解決相關(guān)問題。
“通過算力網(wǎng)上模型應(yīng)用,形成一個集團(tuán)產(chǎn)業(yè)鏈,真正形成對行業(yè)、企業(yè)有價值的解決方法,或者整體解決方案,這樣能夠為企業(yè)帶來降本增效的價值,一定會形成比較爆發(fā)式的應(yīng)用?!标惥S良說。
多重路徑支撐行業(yè)應(yīng)用爆發(fā)
近年來,整個大模型算力正從訓(xùn)練端往推理端快速轉(zhuǎn)移,而未來無論在C端還是B端或?qū)⒊霈F(xiàn)各自非常重要的爆發(fā)時期,其中國內(nèi)的開源模型和AI芯片將發(fā)揮舉足輕重的作用。
張文表示,“國產(chǎn)大模型對國產(chǎn)芯片的發(fā)展特別重要,因為階躍、千問、Deepseek等國產(chǎn)大模型的水平和國外差不多,但國產(chǎn)芯片與國外的距離還比較大。而設(shè)計芯片是挺痛苦的事情,從開始設(shè)計到做出來需要兩年以后,所以一定要有前瞻性才能把芯片設(shè)計好。對此,適配國產(chǎn)大模型公司,對我們的產(chǎn)品定義有非常大的幫助,其中包括針對大模型的超長文本、MOE架構(gòu)、多模態(tài)、大規(guī)模推理等特性需求進(jìn)行調(diào)整?!?/p>
他還稱,國內(nèi)大模型的發(fā)展,從某種意義上是牽動國內(nèi)芯片的設(shè)計發(fā)展。
陳維良則指出,現(xiàn)在國產(chǎn)芯片受到供應(yīng)鏈影響,芯片發(fā)展路線圖或產(chǎn)品特點與國際芯片并不一樣?;诖?,階躍星辰打造了step3,對存算尤其存算比等一些芯片特性進(jìn)行了模型優(yōu)化,這一舉措非常具有代表性,也指出了很好的方向,即芯片和模型之間要有更緊密的合作。
“但還要往前走一步的是,芯片企業(yè)和模型企業(yè)在更深度的算子優(yōu)化上做更多事情以及更開放,由此形成更高效的模型,同時再跟應(yīng)用層以同樣的方式進(jìn)行深度合作,尤其是利用中國的產(chǎn)業(yè)鏈和數(shù)據(jù)優(yōu)勢,真真正正打造立足本土,具有中國特色的自主自強解決方案?!?/p>
對于如何讓模型和芯片配合得更好,蓋魯江認(rèn)為,這需要國產(chǎn)芯片實現(xiàn)兩大突破。
首先是體量。體量一定要上去,只有數(shù)量的積累才能獲取更多的經(jīng)驗。
其次是降本。第一,通過軟件實現(xiàn)模型優(yōu)化和推理應(yīng)用上的降本;提升芯片的使用效率。對芯片廠商而言,這兩方面需要加強突破,包括如何把芯片的使用效率做得更高,功耗做得更低,良率做得更高,把真正推理場景中token的成本等降低,最終讓利給最終用戶。第二,深入到應(yīng)用場景里面去,因為不同的應(yīng)用場景對模型和芯片要求不太一樣,需要提出一攬子的解決方案。第三,通過組建行業(yè)聯(lián)盟,例如本次大會上成立的“模芯生態(tài)創(chuàng)新聯(lián)盟”,打通芯片到整機廠商,再到模型廠商,再到最終應(yīng)用場景的整個鏈條,建立一套統(tǒng)一的規(guī)范和標(biāo)準(zhǔn),這樣可以省去大量的前期投入和適配成本。
“通過三方面實現(xiàn)降本增效,就能達(dá)到真正把模型用起來的最終目的?!彼麖娬{(diào)。
在趙立東看來,國產(chǎn)AI芯片的面前一直有兩座大山,一個是高端芯片制造,另外一個就是生態(tài)。而大模型和芯片的合作一定會涉及生態(tài),這需要雙向奔赴。大模型特別是高性能推理,現(xiàn)在爆發(fā)時間點的機遇是大模型和芯片如何深度優(yōu)化。而基于燧原科技的經(jīng)驗,以及與戰(zhàn)略合作伙伴經(jīng)過幾年磨合,其產(chǎn)品對標(biāo)英偉達(dá)的芯片,性價比可以做到兩倍到三倍。
“此外,我們一直強調(diào)算力普惠。但現(xiàn)在既不普也不惠,這恰恰是國產(chǎn)模型跟國產(chǎn)芯片合作的重要契機。我們期待未來國產(chǎn)大模型與AI芯片企業(yè)非常深入的加強合作,實現(xiàn)低成本、高性能等特性,從而用國產(chǎn)算力支撐大模型的長遠(yuǎn)發(fā)展目標(biāo)?!壁w立東表示。