無論是AI大模型,還是其他數(shù)字技術(shù),關(guān)于開源好,還是閉源好的爭論一直沒有停歇。即便是DeepSeek問世之后,就AI大模型領(lǐng)域而言,開源更好的聲音占據(jù)了主導(dǎo),但仍有一些業(yè)內(nèi)人士認(rèn)為閉源的商業(yè)模式更利于生成式AI的發(fā)展。
通過使用SUSERancher容器管理平臺,中國出口信用保險公司(以下簡稱中國信保)的容器運維從原先的分鐘級響應(yīng),下降到秒級響應(yīng)。此外,圖形化、標(biāo)準(zhǔn)化的操作按鍵降低了容器運維工程師的工作難度——這是中國出口信用保險公司資深技術(shù)專家張濤在與筆者的對話中提到的最為直觀的感受。
在交流中,張濤多次強調(diào),如果從技術(shù)角度考慮,在降本增效的大環(huán)境下,企業(yè)若想在數(shù)字化轉(zhuǎn)型方面,“花更少的錢,辦更大的事”,擁抱開源、融入開源是最好的選擇之一。
在張濤看來,無論是開源,還是閉源,對于用戶而言,能否真正掌握這個技術(shù),在于發(fā)生一些問題之后,能夠快速修復(fù),避免對生產(chǎn)環(huán)境造成影響,這樣的技術(shù)才是真正適合企業(yè)數(shù)字化轉(zhuǎn)型的技術(shù)?!跋鄬Χ?,我認(rèn)為開源是一種很好的生態(tài),有很好的最佳實踐,可以實現(xiàn)群策群力,從而在融入社區(qū)以后,能夠讓開發(fā)者根據(jù)自身的需求和理解,更好地掌控一項技術(shù)?!睆垵缡钦f。
正如張濤所說,開源的模式,能讓企業(yè)更好地掌控一項技術(shù),并在此基礎(chǔ),結(jié)合自身需求,進(jìn)行個性化的創(chuàng)新。與此同時,與閉源的“黑箱”特性致使企業(yè)受制于供應(yīng)商更新節(jié)奏不同的是,開源的方式賦予企業(yè)自主定制與迭代權(quán)的同時,還能確保一些核心數(shù)據(jù)資產(chǎn)的安全。比如,富國銀行在內(nèi)部流程中部署Meta的Llama2,結(jié)合自有數(shù)據(jù)微調(diào),既滿足金融合規(guī)要求,又避免核心業(yè)務(wù)邏輯暴露給第三方。
除此之外,開源技術(shù)也能幫助企業(yè)更好地平衡成本、效率、創(chuàng)新三者的關(guān)系,突破“不可能三角”,并且,通過開源社區(qū)的“群智協(xié)作”可以形成“技術(shù)普惠-知識共享-商業(yè)反哺”的正循環(huán)。
不過,開源特性本身帶來的開放性挑戰(zhàn)也同樣不容忽視。
開源亦是AI的大趨勢
在AI方面,IDC預(yù)測,到2028年,包括中國在內(nèi)的亞太地區(qū)在AI和GenAI上的投資預(yù)計將達(dá)到1750億美元,年復(fù)合增長率高達(dá)33.6%。顯然,中國已經(jīng)成為接下來AI商業(yè)化增長最快的國家和地區(qū)之一。
而AI的發(fā)展同樣面臨開源、閉源的分歧,不過這種分歧隨著DeepSeek的問世,似乎有了明確的答案。閉源AI商業(yè)解決方案雖成熟,卻伴隨高昂授權(quán)費、技術(shù)黑箱和廠商鎖定風(fēng)險;自研AI系統(tǒng)需巨額投入,中小型企業(yè)望而卻步。開源AI則憑借三大核心優(yōu)勢破解這一困局。
比如,德國FIS集團(tuán)選擇了開源的方式,實現(xiàn)AI應(yīng)用。FIS使用了SUSE提供的開源AI平臺,構(gòu)建了SAP智能解決方案,實現(xiàn)發(fā)票處理與實時推薦的敏捷開發(fā),并實現(xiàn)了從令牌使用,到模型性能,再到GPU利用率全鏈路可視化,還滿足歐盟GDPR的合規(guī)要求。
再比如,皓康醫(yī)療采用SUSEAI作為其人工智能基礎(chǔ)設(shè)施,用于運行醫(yī)學(xué)影像分析和醫(yī)學(xué)診斷生成。該方案采用與DeepseekLLM聯(lián)合部署,旨在提升醫(yī)院/診所的患者就醫(yī)體驗,同時符合中國《個人信息的保護(hù)法》(PIPL)的要求。
具體來看,通過采用SUSEAI,皓康醫(yī)療推出了Endoseek內(nèi)鏡報告通智能平臺。該平臺運用自然語言處理技術(shù),能夠?qū)I(yè)的醫(yī)學(xué)報告轉(zhuǎn)化為通俗易懂的解讀,同時智能提示關(guān)鍵診療信息。來自上海某三甲醫(yī)院的臨床數(shù)據(jù)顯示,使用該平臺后,醫(yī)生的報告解讀時間平均縮短了50%以上。
對與此,SUSE大中華區(qū)總裁陳毅威表示,在這場浪潮中,各種AI工具及組件(如大語言模型、庫和框架)更新迭代很快,因此企業(yè)選擇一款自由、開源的AI平臺就顯得格外重要。作為一款業(yè)內(nèi)領(lǐng)先的安全、私有化、面向未來的企業(yè)級生成式AI(GenAI)平臺,SUSEAI提供了開放的企業(yè)級AI基礎(chǔ)架構(gòu),具備高度的可擴展性,無論是增加新的用例,還是在企業(yè)內(nèi)部擴展AI應(yīng)用,都能輕松滿足需求,助力企業(yè)應(yīng)對未來挑戰(zhàn)。
除此之外,也有不少的國際巨頭在布局開源AI。IBM的AskHR系統(tǒng)基于Llama2開源模型構(gòu)建,為28.5萬名員工提供人力資源智能問答服務(wù)。其營銷部門利用開源框架開發(fā)的AI內(nèi)容生成工具,可自動適配全球不同市場的品牌規(guī)范,使跨國營銷活動部署周期從月級縮短至72小時;日本廣告巨頭CyberAgent采用戴爾開源工具鏈開發(fā)OpenCALM日語大模型,為制造業(yè)企業(yè)提供定制化質(zhì)量控制方案。某汽車零部件廠商基于此模型訓(xùn)練視覺檢測系統(tǒng),將缺陷識別準(zhǔn)確率提升至99.2%,而開發(fā)成本僅為閉源方案的1/5。
陳毅威向筆者表達(dá)了他對于開源AI如此之火的一些看法,他認(rèn)為,對于生成式AI而言,開源是一種更優(yōu)的模式,“因為開源可以為創(chuàng)新提供非常好的平臺。如果有了開源,創(chuàng)新就不再是說誰提出這個新點子,誰才能參與,而是全世界的任何一個人、每個人都可以參與到創(chuàng)新的過程當(dāng)中來,這樣就可以保證全世界有更高質(zhì)量的、更安全的平臺,以及創(chuàng)新的迭代速度也會更快?!标愐阃赋?。
值得注意的是,開源大模型帶來的不僅是技術(shù)迭代,更是一場生產(chǎn)關(guān)系的重構(gòu)。以DeepSeek-R1為例,其推理成本僅為OpenAIo1模型的1/30,但數(shù)學(xué)推理和代碼生成能力卻達(dá)到同等水平。成本斷崖式下降”的突破,使得中小企業(yè)和開發(fā)者能以極低成本調(diào)用頂尖AI能力。例如,歐洲開發(fā)者基于DeepSeek-R1僅用兩周時間便開發(fā)出本地化的法律文書生成工具,成本較閉源方案降低90%。
開源也有挑戰(zhàn)
開源的模式雖然能夠平衡企業(yè)成本、效率、創(chuàng)新三者之間的關(guān)系,達(dá)到最具性價比的方式。但因為開源社區(qū)的模式,讓幾乎所有人都能對軟件進(jìn)行升級、改造,這也帶來了一些安全風(fēng)險。
比如,一套Kubernetes平臺,依賴的第三方組件非常之多,難以全面掌控,對于一些運維團(tuán)隊人員并不是很充足或經(jīng)驗不是很豐富的企業(yè)來說,如何管理好這套開源容器平臺本身就是一個難題,尤其是使用這套開源容器平臺作為IT基座保障業(yè)務(wù)數(shù)字化轉(zhuǎn)型的過程中,如何確保核心業(yè)務(wù)的安全穩(wěn)定運行,自然成為了最大挑戰(zhàn)。
在中國信保的張濤看來,面臨安全穩(wěn)定運行的挑戰(zhàn),企業(yè)單純依靠供應(yīng)商來確保是不夠的,在面對如何應(yīng)用好開源技術(shù),賦能業(yè)務(wù)的提問時,張濤表示,從技術(shù)角度考慮,企業(yè)需要注意三個方面的問題。
首先,企業(yè)內(nèi)部的IT團(tuán)隊,至少得有人熟悉開源技術(shù),不能被廠商的思路帶著走,“企業(yè)需要明白哪些技術(shù)能帶給你切實的幫助,怎么用更好。”張濤如是說。
進(jìn)而,企業(yè)擁抱開源之后,還需要找到技術(shù)真正落地的場景。在張濤看來,一個技術(shù)只有能真正解決企業(yè)存在的問題,才是值得做的,“這時候,企業(yè)需要以問題為導(dǎo)向,而不是盲目追風(fēng)?!睆垵龔娬{(diào)。
最后,張濤與陳毅威都曾多次向筆者表示,開源公司與用戶之間的合作,不僅是“一錘子買賣”的買產(chǎn)品模式,而是需要開源公司與用戶更多的交流,“產(chǎn)品僅僅是開始,后續(xù)的服務(wù)才是當(dāng)下一件軟件公司最核心的競爭力?!痹谂c陳毅威的交流之中,他曾多次向筆者強調(diào)。
另一方面,就當(dāng)下開源AI的安全問題,據(jù)SUSE統(tǒng)計,隱私和數(shù)據(jù)安全(57%)以及人工智能驅(qū)動的網(wǎng)絡(luò)攻擊(55%)是生成式AI云安全的首要問題,只有7%的IT決策者認(rèn)為不存在相關(guān)安全風(fēng)險。而這個風(fēng)險在開源方面更需要企業(yè)注意。
此外,據(jù)統(tǒng)計,2024年84%的代碼庫存在已知漏洞,48%含高風(fēng)險漏洞;開源AI漏洞事件年增長超650%。顯然,安全問題已經(jīng)成為了當(dāng)前開源AI面臨的最大挑戰(zhàn)之一。
企業(yè)如何應(yīng)對開源AI帶來的挑戰(zhàn)呢?可觀測是一個比較常見的應(yīng)對手段。還是以FIS集團(tuán)為例,其通過SUSEAI實現(xiàn)“令牌使用-模型性能-GPU利用率”全鏈路可視化的同時,風(fēng)控響應(yīng)還速度提升300%,而接下來,關(guān)于開源的市場的爭奪,除了在性能與價錢的“卷”之外,安全、可控、可視化也是一個重要的方向。
除此之外,SUSE人工智能創(chuàng)新與孵化全球負(fù)責(zé)人IanQuackenbos還與筆者分享了SUSE的“AI護(hù)欄”技術(shù)。lan表示,AI護(hù)欄技術(shù)主要有三個方面的作用。首先就是幫助企業(yè)滿足在各個國家及地區(qū)的合規(guī)的要求;第二是“監(jiān)督”大模型本身,確保其不會出現(xiàn)原則性的問題,并對提示詞進(jìn)行規(guī)范化管理;第三是實時監(jiān)控,確保企業(yè)級大模型不會被數(shù)據(jù)“投毒”,并確保各個層級的用戶獲取信息的權(quán)限,避免出現(xiàn)信息泄露與惡意攻擊。
開源技術(shù)既是數(shù)字文明的基石,也是安全攻防的主戰(zhàn)場。從Log4j2漏洞的全球震蕩,到DeepSeek的數(shù)據(jù)泄露;從社區(qū)維護(hù)者的孤軍奮戰(zhàn),到FraudGPT的惡意狂歡,企業(yè)在利用開源技術(shù)的同時,也需想好如何應(yīng)對其帶來的挑戰(zhàn)。(本文首發(fā)于鈦媒體APP,作者|張申宇,編輯丨蓋虹達(dá))