熱度空前的世界人工智能大會(WAIC)余溫未散,上海再迎盛會。8月2日至3日,2025CCF中國開源大會(以下簡稱“開源大會”)在滬召開。
現(xiàn)身此次會議的宇樹科技創(chuàng)始人王興興給出一則判斷:具身智能要在陌生場景中真正服務(wù)于人,需實時生成各類動作。他認為,目前,機器人整機硬件已夠用,但具身智能大模型仍有巨大缺口,正“期待一個屬于機器人的ChatGPT時刻”。可以說,精確數(shù)據(jù)的獲取難度,也是當(dāng)前具身智能機器人升級所面臨的難題。
包括王興興在內(nèi),多位與會專家學(xué)者不約而同將討論的熱點聚焦于人工智能(AI)時代繞不開的核心話題——開源。
AI時代,開源有何重要意義?又面臨哪些困境與挑戰(zhàn)?突圍之路又在何方?
AI重塑開源版圖:共享協(xié)作推動技術(shù)普惠
所謂開源,就是公開代碼供所有人查看、使用、修改與再分享,其“共享、協(xié)作、透明”的精神不僅影響軟件領(lǐng)域,更延伸至教育、科研、硬件(如開源芯片)等領(lǐng)域,鼓勵通過集體協(xié)作解決問題,推動技術(shù)普惠。
AI時代,為何開源至關(guān)重要?中國工程院院士、清華大學(xué)計算機系教授鄭緯民介紹,AI大模型的生命周期一般包括五個環(huán)節(jié),其中,數(shù)據(jù)獲取、預(yù)處理與模型訓(xùn)練前三個環(huán)節(jié)需海量數(shù)據(jù)與算力,成本高昂,非一般公司能負擔(dān)。而開源,則有望讓小公司也能直接基于大公司的模型,跳過前三個環(huán)節(jié),專注于模型微調(diào)和推理。
另一方面,AI的進步依賴“不斷試錯、持續(xù)優(yōu)化”。一個模型需經(jīng)無數(shù)場景測試,單靠一家公司難以窮盡。所以,開源能讓全球開發(fā)者共同“找茬”、協(xié)同改進。正如中國科學(xué)院院士、南京大學(xué)教授呂建所言:“開源決定規(guī)模,規(guī)模決定涌現(xiàn),涌現(xiàn)成就顛覆?!?/p>
開源大幅降低了互聯(lián)網(wǎng)技術(shù)的使用成本,讓小公司、個人開發(fā)者得以參與到技術(shù)浪潮中,催生出更多新想法、新服務(wù)。上海交通大學(xué)校長、中國科學(xué)院院士丁奎嶺也指出,開源不僅是當(dāng)前全球科技創(chuàng)新的技術(shù)風(fēng)尚,更是推動開放發(fā)展、共同發(fā)展的重要路徑。
若數(shù)據(jù)不開放,AI開源就不是真正的開源
AI在持續(xù)迭代的過程中,數(shù)據(jù)尤其核心?!癆I正在經(jīng)歷從‘模型中心’向‘?dāng)?shù)據(jù)中心’的范式轉(zhuǎn)變?!敝袊茖W(xué)院院士、北京大學(xué)教授、上海交通大學(xué)人工智能學(xué)院首席顧問鄂維南指出,高質(zhì)量、高效率的數(shù)據(jù)基礎(chǔ)設(shè)施是降低AI落地門檻的關(guān)鍵。
作為人口大國,數(shù)據(jù)本是我國的優(yōu)勢。但在此次論壇上,多位與會的專家都提及一個共同的現(xiàn)實困境:一方面,數(shù)據(jù)作為企業(yè)核心資產(chǎn),價值愈發(fā)被重視;另一方面,隨著公眾數(shù)據(jù)保護與安全意識的提升,大量數(shù)據(jù)因“安全考慮”無法公開?!拔覈髷?shù)據(jù)建設(shè)推進多年,卻在一些領(lǐng)域出現(xiàn)了‘倒退’跡象,甚至不少數(shù)據(jù)即便收集完成、研究有了成果,落地卻杳無音信?!?/p>
“所謂的AI開源,若數(shù)據(jù)不開放,就不是軟件開源所定義的開源。”中國科學(xué)院院士、北京大學(xué)教授梅宏解釋道,即便大模型參數(shù)公開,若外界沒有相同的訓(xùn)練數(shù)據(jù),也難以復(fù)現(xiàn)其能力,更談不上迭代創(chuàng)新。當(dāng)AI的核心生產(chǎn)資料——數(shù)據(jù),因商業(yè)價值與安全合規(guī)問題被“鎖在家里”時,傳統(tǒng)開源模式便陷入了“無米之炊”的困境。
從“開源”到“開放”,亟需共建新生態(tài)
面對AI時代的挑戰(zhàn),傳統(tǒng)開源模式漸顯乏力,破題抓手在哪里?多位專家認為,當(dāng)務(wù)之急是構(gòu)建一個更高維的“開放”解法。
開放數(shù)據(jù)的核心是“數(shù)據(jù)資源的有條件共享”?;仡櫲祟惖臄?shù)據(jù)開放史,本身就是從封閉走向分層開放的進化過程。所以,從開源到開放,并非倒退。例如,互聯(lián)網(wǎng)早期“黃頁”都主動公開電話號碼,而現(xiàn)代隱私保護法則要求“最小必要”等原則,這不是倒退,而是數(shù)據(jù)管理的升級。
開放數(shù)據(jù)通常附帶場景限制,如禁止商業(yè)濫用、需脫敏處理,且不允許修改原始數(shù)據(jù),目的是釋放數(shù)據(jù)價值以支撐AI訓(xùn)練與科研分析。以醫(yī)療數(shù)據(jù)為例,需去除隱私信息后開放,且僅限科研使用,不得修改原始屬性。
如專家們所說,“開放更具有長遠的價值”,其范疇涵蓋標(biāo)準(zhǔn)、API、平臺等多個維度。AI時代,開放架構(gòu)(如分層接口標(biāo)準(zhǔn)化)比單純開源代碼更易推動二次創(chuàng)新,適配AI快速迭代需求。
中國工程院院士、中國工程院原副院長陳左寧指出,AI時代,設(shè)計精良的“開放架構(gòu)”可能比完全公開的源代碼更有意義。從“給代碼”到“給接口、給標(biāo)準(zhǔn)、給合作框架”,將能讓不同創(chuàng)新者在各自擅長的領(lǐng)域(如底層硬件適配、上層應(yīng)用開發(fā))便捷接入與貢獻,大幅降低協(xié)作門檻,構(gòu)建高效創(chuàng)新生態(tài)。
2025CCF中國開源大會由中國計算機學(xué)會(CCF)主辦、上海交通大學(xué)和CCF開源發(fā)展技術(shù)委員會承辦。
「推文」五本攻略反派文,強推《家養(yǎng)反派》,又甜又寵超刺激...
第五本《反派皆男神[快穿]》作者:唐宓短評:萌甜治愈系快穿文,每個小故事都是經(jīng)典小言,女主性子堅韌,智商在線不圣母,用真心攻略男主,男主是不斷經(jīng)歷磨難的反派小可憐,性子偏執(zhí)易黑化——_。男女主角的相處讓人覺得暖暖的,劇情爽點OK,甜度適中,不黑原男女主角||。后面作者會交代女主為何會穿越,為何需要攻略男主。往期回顧:「推文 5、《飼養(yǎng)反派小團子》——云上淺酌簡介:寧婧有一個飼養(yǎng)反派系統(tǒng)。每一個世界都有那么一些呼風(fēng)喚雨、陰險變態(tài)的反派大BOSS,寧婧的任務(wù)就是回到反派的小糯團時期,飼養(yǎng)他們八年。時間一到,她便會被強制踢出這個世界,去完成下個任務(wù)|-。寧婧兢兢業(yè)業(yè)地完成了幾個任務(wù)后,忽然發(fā)現(xiàn)——自己飼養(yǎng)過的軟萌天真小等我繼續(xù)說。五本男主是反派的小說:不怕反派壞,就怕反派長得帥