國產(chǎn)AI大模型正迎來一波密集的“開源潮”。7月30日,南都灣財社記者從中興通訊方面獲悉,其宣布一次性開源11項核心技術成果,包括6個自研大模型和5個行業(yè)數(shù)據(jù)集。
“小樣本高效訓練”模式
為降低AI開發(fā)成本提供可能性
在開源的6個大模型中,NTele-R1-32B-V1電信大模型是其中的焦點。該模型使用約800個經(jīng)過篩選的樣本進行訓練,“小樣本高效訓練”的模式,為降低AI開發(fā)成本提供了新的可能性。中興通訊AI研發(fā)中心負責人表示,“NTele-R1-32B-V1是從DeepSeek-32B-Distill訓練的,實現(xiàn)了‘少而精’的訓練效果”。目前,該數(shù)據(jù)集已同步開源,開發(fā)者可直接獲取用于模型優(yōu)化。
針對多模態(tài)領域,中興通訊開源了7B和3B參數(shù)的兩款模型。這兩款模型通過“課程強化學習”與“拒絕樣本自我改進”機制,使小參數(shù)模型獲得與更大規(guī)模模型相近的推理能力。該技術路徑適用于智能終端、邊緣計算等計算資源受限的場景。
同步開源的5個數(shù)據(jù)集中,TFCE數(shù)據(jù)集是為電信行業(yè)AI開發(fā)設計的函數(shù)調用測評工具。據(jù)介紹,該數(shù)據(jù)集整合了中興通訊的技術積累,包含1800余個函數(shù)和917道Python題目,覆蓋了4G到6G的核心技術應用場景。
此次開源是在“煥新社區(qū)”的背景下。據(jù)悉,“煥新社區(qū)”是由國務院國資委指導、中國移動牽頭運營的國家級AI開源開放平臺,也是國家推動AI自主生態(tài)建設的最新舉措之一,中興通訊此次開源的項目,成為該平臺收到的首批核心技術。
中興通訊高級副總裁張萬春表示,中興將以技術開源為紐帶,在模型創(chuàng)新、算力優(yōu)化、場景落地三大領域深度參與,為中國AI自主可控體系提供支撐。
國家級平臺牽引
龍頭企業(yè)貢獻核心技術
從行業(yè)來看,AI技術的競爭正從單一的模型能力比拼,延伸至涵蓋軟硬件適配和開發(fā)者生態(tài)的全方位競爭。開源協(xié)同,正成為構建自主技術體系的關鍵路徑。
事實上,這股“開源潮”在近期的世界人工智能大會上表現(xiàn)得尤為明顯。大會期間,階躍星辰便宣布其新一代基礎大模型Step-3將于7月31日向全球開源。與此同時,阿里云也在此前透露其通義千問模型開源后下載量已突破4億次。值得注意的是,開源正與國產(chǎn)算力深度綁定,階躍星辰聯(lián)合華為昇騰、沐曦等近10家國產(chǎn)芯片企業(yè)共同發(fā)起了“模芯生態(tài)創(chuàng)新聯(lián)盟”,旨在構建從芯片到模型的協(xié)同創(chuàng)新體系。
這一趨勢背后,是國內(nèi)大模型產(chǎn)業(yè)從追求“通用”到深耕“垂直”的集體轉向。“通用大模型好比是大學生,知識面廣但解決不了專業(yè)問題。行業(yè)現(xiàn)在需要的是有深厚領域知識的‘??撇┦俊?,”一位AI行業(yè)分析師向南都灣財社記者表示,“開源電信模型和數(shù)據(jù)集,價值不在于參數(shù)大小,而在于其高度的專業(yè)性和稀缺性,這正是產(chǎn)業(yè)應用需要的東西?!?/p>
此外,高質量的國產(chǎn)開源模型生態(tài),也被視為激活國產(chǎn)AI芯片產(chǎn)業(yè)鏈的關鍵。過去,國產(chǎn)AI芯片廠商在追趕英偉達時,不僅面臨硬件性能的差距,更受制于CUDA生態(tài)的壁壘。
“沒有好用的模型和工具鏈,我們的芯片就只是‘裸奔’的硬件?!币患覈a(chǎn)AI芯片公司的技術負責人對記者坦言,“開源的這些適配好的模型,為我們提供了一個完整的測試和優(yōu)化靶場,能夠加速軟硬件一體化的進程,這是打破國外生態(tài)壟斷的必要一步。”
行業(yè)分析指出,這種由國家級平臺牽引、龍頭科技企業(yè)貢獻核心技術的“國家隊+主力隊員”協(xié)同模式,正成為國內(nèi)AI產(chǎn)業(yè)發(fā)展的新趨勢。通過開源共享,可以降低創(chuàng)新門檻,加速技術迭代和應用落地,推動中國AI產(chǎn)業(yè)從“技術跟跑”向“生態(tài)領跑”進行轉變,為構建自主可控的AI技術體系提供支撐。
采寫:南都·灣財社記者嚴兆鑫
延伸閱讀:與 中:《興通訊開》!!源6個自研大模型 的相關文章