國(guó)產(chǎn)AI大模型正迎來(lái)一波密集的“開(kāi)源潮”。7月30日,南都灣財(cái)社記者從中興通訊方面獲悉,其宣布一次性開(kāi)源11項(xiàng)核心技術(shù)成果,包括6個(gè)自研大模型和5個(gè)行業(yè)數(shù)據(jù)集。
在開(kāi)源的6個(gè)大模型中,NTele-R1-32B-V1電信大模型是其中的焦點(diǎn)。該模型使用約800個(gè)經(jīng)過(guò)篩選的樣本進(jìn)行訓(xùn)練,“小樣本高效訓(xùn)練”的模式,為降低AI開(kāi)發(fā)成本提供了新的可能性。中興通訊AI研發(fā)中心負(fù)責(zé)人表示,“NTele-R1-32B-V1是從DeepSeek-32B-Distill訓(xùn)練的,實(shí)現(xiàn)了‘少而精’的訓(xùn)練效果?!蹦壳?,該數(shù)據(jù)集已同步開(kāi)源,開(kāi)發(fā)者可直接獲取用于模型優(yōu)化。
針對(duì)多模態(tài)領(lǐng)域,中興通訊開(kāi)源了7B和3B參數(shù)的兩款模型。這兩款模型通過(guò)“課程強(qiáng)化學(xué)習(xí)”與“拒絕樣本自我改進(jìn)”機(jī)制,使小參數(shù)模型獲得與更大規(guī)模模型相近的推理能力。該技術(shù)路徑適用于智能終端、邊緣計(jì)算等計(jì)算資源受限的場(chǎng)景。
同步開(kāi)源的5個(gè)數(shù)據(jù)集中,TFCE數(shù)據(jù)集是為電信行業(yè)AI開(kāi)發(fā)設(shè)計(jì)的函數(shù)調(diào)用測(cè)評(píng)工具。據(jù)介紹,該數(shù)據(jù)集整合了中興通訊的技術(shù)積累,包含1800余個(gè)函數(shù)和917道Python題目,覆蓋了4G到6G的核心技術(shù)應(yīng)用場(chǎng)景。
此次開(kāi)源是在“煥新社區(qū)”的背景下。據(jù)悉,“煥新社區(qū)”是由國(guó)務(wù)院國(guó)資委指導(dǎo)、中國(guó)移動(dòng)牽頭運(yùn)營(yíng)的國(guó)家級(jí)AI開(kāi)源開(kāi)放平臺(tái),也是國(guó)家推動(dòng)AI自主生態(tài)建設(shè)的最新舉措之一,中興通訊此次開(kāi)源的項(xiàng)目,成為該平臺(tái)收到的首批核心技術(shù)。
中興通訊高級(jí)副總裁張萬(wàn)春表示,中興將以技術(shù)開(kāi)源為紐帶,在模型創(chuàng)新、算力優(yōu)化、場(chǎng)景落地三大領(lǐng)域深度參與,為中國(guó)AI自主可控體系提供支撐。
從行業(yè)來(lái)看,AI技術(shù)的競(jìng)爭(zhēng)正從單一的模型能力比拼,延伸至涵蓋軟硬件適配和開(kāi)發(fā)者生態(tài)的全方位競(jìng)爭(zhēng)。開(kāi)源協(xié)同,正成為構(gòu)建自主技術(shù)體系的關(guān)鍵路徑。
事實(shí)上,這股“開(kāi)源潮”在近期的世界人工智能大會(huì)上表現(xiàn)得尤為明顯。大會(huì)期間,階躍星辰便宣布其新一代基礎(chǔ)大模型Step-3將于7月31日向全球開(kāi)源。與此同時(shí),阿里云也在此前透露其通義千問(wèn)模型開(kāi)源后下載量已突破4億次。值得注意的是,開(kāi)源正與國(guó)產(chǎn)算力深度綁定,階躍星辰聯(lián)合華為昇騰、沐曦等近10家國(guó)產(chǎn)芯片企業(yè)共同發(fā)起了“模芯生態(tài)創(chuàng)新聯(lián)盟”,旨在構(gòu)建從芯片到模型的協(xié)同創(chuàng)新體系。
這一趨勢(shì)背后,是國(guó)內(nèi)大模型產(chǎn)業(yè)從追求“通用”到深耕“垂直”的集體轉(zhuǎn)向?!巴ㄓ么竽P秃帽仁谴髮W(xué)生,知識(shí)面廣但解決不了專業(yè)問(wèn)題。行業(yè)現(xiàn)在需要的是有深厚領(lǐng)域知識(shí)的‘??撇┦俊?,”一位AI行業(yè)分析師向南都灣財(cái)社記者表示,“開(kāi)源電信模型和數(shù)據(jù)集,價(jià)值不在于參數(shù)大小,而在于其高度的專業(yè)性和稀缺性,這正是產(chǎn)業(yè)應(yīng)用需要的東西?!?/p>
此外,高質(zhì)量的國(guó)產(chǎn)開(kāi)源模型生態(tài),也被視為激活國(guó)產(chǎn)AI芯片產(chǎn)業(yè)鏈的關(guān)鍵。過(guò)去,國(guó)產(chǎn)AI芯片廠商在追趕英偉達(dá)時(shí),不僅面臨硬件性能的差距,更受制于CUDA生態(tài)的壁壘。
“沒(méi)有好用的模型和工具鏈,我們的芯片就只是‘裸奔’的硬件?!币患覈?guó)產(chǎn)AI芯片公司的技術(shù)負(fù)責(zé)人對(duì)記者坦言,“開(kāi)源的這些適配好的模型,為我們提供了一個(gè)完整的測(cè)試和優(yōu)化靶場(chǎng),能夠加速軟硬件一體化的進(jìn)程,這是打破國(guó)外生態(tài)壟斷的必要一步。”
行業(yè)分析指出,這種由國(guó)家級(jí)平臺(tái)牽引、龍頭科技企業(yè)貢獻(xiàn)核心技術(shù)的“國(guó)家隊(duì)+主力隊(duì)員”協(xié)同模式,正成為國(guó)內(nèi)AI產(chǎn)業(yè)發(fā)展的新趨勢(shì)。通過(guò)開(kāi)源共享,可以降低創(chuàng)新門檻,加速技術(shù)迭代和應(yīng)用落地,推動(dòng)中國(guó)AI產(chǎn)業(yè)從“技術(shù)跟跑”向“生態(tài)領(lǐng)跑”進(jìn)行轉(zhuǎn)變,為構(gòu)建自主可控的AI技術(shù)體系提供支撐。
采寫:南都灣財(cái)社記者嚴(yán)兆鑫
真心安利《最后一個(gè)女?dāng)繆y師》TOP3情節(jié)追到不愿放開(kāi)手!
10位女明星生孩子后的變化,有人像沒(méi)生過(guò),也有人生完像換了個(gè)人...
特別推薦潛力好書《最后一個(gè)女?dāng)繆y師》,甜蜜橋段讓你入坑不后悔!