數(shù)據(jù)語料被惡意行為者篡改,人工智能大模型輸出的結(jié)果就帶有特殊目的性,違背了現(xiàn)實(shí)真實(shí)情況;人工智能多模態(tài)大模型自動(dòng)生成的圖片、視頻具有欺騙性和誤導(dǎo)性,且其操作門檻極低,導(dǎo)致他人合法權(quán)益被侵害……在2025世界人工智能大會(huì)暨人工智能全球治理高級(jí)別會(huì)議主論壇上,“AI教父”辛頓將人工智能比喻為可愛的小老虎,但同時(shí)也警示人們防止“養(yǎng)虎為患”。
人工智能時(shí)代,安全對(duì)于高質(zhì)量發(fā)展的基石作用更加凸顯。在這樣的背景下,連日來,作為通信基礎(chǔ)設(shè)施建設(shè)“國家隊(duì)”、5G新基建“主力軍”的三大運(yùn)營商,在大會(huì)現(xiàn)場(chǎng)競(jìng)相展示他們?cè)谌斯ぶ悄馨踩I(lǐng)域的前沿探索與創(chuàng)新成果。
針對(duì)人工智能應(yīng)用帶來的算法、數(shù)據(jù)及倫理風(fēng)險(xiǎn),2025世界人工智能大會(huì)暨人工智能全球治理高級(jí)別會(huì)議期間,中國電信宣布:打造大模型基礎(chǔ)護(hù)欄,并在國內(nèi)首次開源;提升中文提示詞注入攻擊防護(hù)、敏感信息泄露防護(hù)、生成內(nèi)容合規(guī)檢查等能力;針對(duì)應(yīng)用安全,打造大模型安全掃描器,形成輸入可防、推理過程可檢測(cè)、輸入可控的模型及智能體應(yīng)用防護(hù)體系等。
中國電信相關(guān)負(fù)責(zé)人表示:“以我們前期發(fā)布的見微安全大模型為例,它能夠?qū)崟r(shí)洞察高級(jí)威脅,精準(zhǔn)預(yù)測(cè)攻擊路徑,自動(dòng)閉環(huán)處置漏洞,顛覆傳統(tǒng)的碎片化分析模式,告警識(shí)別準(zhǔn)確率98%,提升整體安全響應(yīng)效率60%以上,讓安全防御從‘被動(dòng)應(yīng)對(duì)’邁向‘主動(dòng)免疫’,實(shí)現(xiàn)‘以模治?!??!?/p>
7月27日,中國移動(dòng)“人工智能安全評(píng)測(cè)平臺(tái)”正式亮相,平臺(tái)基于覆蓋模型算法安全、數(shù)據(jù)安全、環(huán)境安全、倫理合規(guī)的4維37項(xiàng)評(píng)測(cè)指標(biāo)體系,可面向智能體、模型算法、訓(xùn)練數(shù)據(jù)等多類型AI資產(chǎn),提供多維度全方位的安全評(píng)測(cè)服務(wù)。
展臺(tái)上,正在進(jìn)行現(xiàn)場(chǎng)路演,只見工作人員輕點(diǎn)鼠標(biāo),將基于《生成式人工智能服務(wù)安全基本要求》(國標(biāo)TC260-003)構(gòu)建的安全評(píng)測(cè)數(shù)據(jù)集快速發(fā)送至被測(cè)模型,隨即,被測(cè)模型返回的一問一答在屏幕上有序呈現(xiàn)。平臺(tái)迅速對(duì)這些問答對(duì)展開合規(guī)評(píng)判,最終輸出的安全評(píng)測(cè)結(jié)果精準(zhǔn)覆蓋各項(xiàng)合規(guī)維度,同時(shí),還清晰標(biāo)注出潛在風(fēng)險(xiǎn)點(diǎn)。
中國移動(dòng)相關(guān)負(fù)責(zé)人介紹:“該平臺(tái)基于15萬余組安全評(píng)測(cè)數(shù)據(jù)集,能夠提供內(nèi)容合規(guī)安全檢測(cè)、模型對(duì)抗攻擊、數(shù)據(jù)質(zhì)量評(píng)估等評(píng)測(cè)服務(wù),基于量化指標(biāo),實(shí)現(xiàn)AI安全風(fēng)險(xiǎn)的精準(zhǔn)畫像與量化評(píng)估?!?/p>
此外,平臺(tái)還支持自動(dòng)化評(píng)測(cè),能夠根據(jù)不同場(chǎng)景需求快速調(diào)整評(píng)測(cè)方案,以高度靈活性適配多樣化AI安全評(píng)測(cè)需求。
2025世界人工智能大會(huì)暨人工智能全球治理高級(jí)別會(huì)議召開前夕,中國聯(lián)通“元景·智盾”數(shù)智安全治理平臺(tái)正式發(fā)布。“元景·智盾”平臺(tái)由三大核心板塊組成:AI數(shù)據(jù)安全、AI模型與應(yīng)用服務(wù)安全、AI治理與合規(guī)服務(wù),全方位構(gòu)建覆蓋模型、數(shù)據(jù)及算法應(yīng)用的全棧式AI安全防護(hù)體系。
“‘元景·智盾’平臺(tái)基于龐大的內(nèi)容數(shù)據(jù)庫和算法庫,能夠提供圖像、視頻、音頻偽造檢測(cè)以及人工智能合成文本檢測(cè)服務(wù),支持對(duì)檢測(cè)內(nèi)容進(jìn)行溯源與可解釋性分析?!敝袊?lián)通相關(guān)負(fù)責(zé)人表示,“這使得我們能夠有效對(duì)數(shù)據(jù)偽造內(nèi)容進(jìn)行取證,廣泛應(yīng)用于偵查取證、業(yè)務(wù)數(shù)據(jù)精細(xì)化檢測(cè)等場(chǎng)景,有力保障業(yè)務(wù)數(shù)據(jù)的安全?!?/p>
據(jù)悉,目前,該平臺(tái)在政務(wù)、醫(yī)療、運(yùn)營商等領(lǐng)域的多個(gè)場(chǎng)景中均已實(shí)現(xiàn)落地應(yīng)用。
原標(biāo)題:《“國家隊(duì)”出手,齊筑人工智能安全防線,以模治模,防止“養(yǎng)虎為患”》
來源:作者:解放日?qǐng)?bào)吳衛(wèi)群高晨輝
免責(zé)聲明:本文內(nèi)容由開放的智能模型自動(dòng)生成,僅供參考。