從4米到4厘米的高清掃圖、讓古文物“開口說話”、“真假人臉”科技較量.....在日前正式開幕的2025世界人工智能大會(WAIC)上,合合信息展臺人頭濟濟。南都N視頻記者了解到,此次,其主要結(jié)合自身技術(shù)優(yōu)勢和社會需求洞察,推出了以“大尺寸掃描”功能為代表的“無限掃描”技術(shù),以及應(yīng)用在人臉視頻、AIGC生成圖像、證件票據(jù)等場景中的AI鑒偽技術(shù),以為AI后續(xù)落地和安全相關(guān)問題保駕護航。
發(fā)布AI掃描新功能,大小尺寸圖像清晰掃描
本次WAIC期間,合合信息旗下掃描全能王推出了以“大尺寸掃描”功能為代表的“無限掃描”技術(shù)。據(jù)合合信息方面介紹,受限于設(shè)備、環(huán)境、距離,操作者在拍攝巨幅文物時,經(jīng)常面臨“單張拍不全,全幅拍太糊,多張拼不齊”的困境。即使使用圖像拼接工具,局部圖像自身存在的畸變、色彩失真等問題也無法得到有效解決,影響整體效果。
而針對這些問題,掃描全能王提出了“多行、多列視頻拍攝”形式。為了保證成像質(zhì)量,其還應(yīng)用了AI智能高清算法,對圖像進行分區(qū)優(yōu)化和光影均衡化處理,確保整張圖像清晰度提升、光影過渡自然。
在此次合合信息展位上,其展示了一幅長度近4米的畫作《坤輿萬國全圖》。據(jù)悉,作為南京博物院的“鎮(zhèn)院之寶”之一,現(xiàn)場展示版本原件成圖于1608年,長3.85米,寬1.71米,目前是國內(nèi)現(xiàn)存最早、最完整、內(nèi)容最豐富的中文世界地圖。
大會現(xiàn)場,觀眾可以上下、左右滑動拍攝視頻,AI在“觀看”視頻后,理解圖像、文字特征并挑選出合適的局部圖像,優(yōu)化圖像質(zhì)量,拼接形成一張高清、美觀的大圖。另外,基于AI對圖像的理解,掃描全能王還可智能識別《坤輿萬國全圖》中的山河疆域、神奇動物等元素,當觀眾點擊指定區(qū)域時便能了解到對應(yīng)的介紹。
除了超大尺寸圖像的無痕拼接處理外,4厘米長的極小圖像也能實現(xiàn)細節(jié)還原,在此次“智能高清濾鏡”展區(qū)陳放著《星空》《向日葵》等4厘米寬、拇指大小的微縮油畫,經(jīng)過AI掃描技術(shù)處理,原本肉眼難辨的圖案變得纖毫畢現(xiàn)。
深度偽造欺詐損失近9億美元,上新AI鑒偽技術(shù)
另外,在合合信息AI安全展臺互動區(qū)觀眾也排起長隊,體驗一場有關(guān)“真假人臉”的科技較量。站在屏幕前掃描面部,系統(tǒng)就會實時生成一個“數(shù)字假面”,近乎完美地復(fù)刻了真實人臉的表情紋路。據(jù)合合信息技術(shù)團隊人員介紹,展會互動裝置中實時生成的“假臉”由當前主流偽造算法生成。
從傳統(tǒng)圖像編輯軟件到生成式大模型,AI讓圖像、視頻等內(nèi)容生成的手段愈發(fā)簡單,也讓信息篡改的形式更隱蔽,載體更多樣,讓人防不勝防。網(wǎng)絡(luò)加速器供應(yīng)商Surfshark公布的數(shù)據(jù)顯示,2025年上半年,深度偽造相關(guān)金融欺詐造成全球損失近9億美元,AI偽造能力的泛濫正在沖擊個人權(quán)益、經(jīng)濟秩序與社會信任體系。
針對于此,在此次WAIC上,合合信息帶來了AI鑒偽技術(shù)在人臉視頻、AIGC生成圖像、證件票據(jù)等當今AI偽造“重災(zāi)區(qū)”中的應(yīng)用體驗,幫助參觀者了解AI如何通過視覺特征、圖像合理性判斷、多維度交叉驗證,以洞察多模態(tài)信息中“看不見”的偽造痕跡,為大模型安全、可信發(fā)展筑起“凈化防線”。
據(jù)介紹,合合信息技術(shù)團隊針對主流人臉偽造算法進行研究,采用持續(xù)增量學(xué)習策略,與最新偽造算法同步迭代。基于大規(guī)模數(shù)據(jù)訓(xùn)練,形成了多層次篡改檢測方案,實現(xiàn)毫秒級實時鑒定。此外,面臨更復(fù)雜的偽造情況,例如由偽造算法直接生成的復(fù)雜圖像。團隊還采用了多種神經(jīng)網(wǎng)絡(luò)模型,聚焦于圖像特征,實現(xiàn)多維度交叉驗證真?zhèn)?,讓判斷結(jié)果更精準。
據(jù)合合信息技術(shù)團隊人員介紹,實際應(yīng)用場景中,AI生成圖像會經(jīng)歷壓縮、縮放、裁剪及社交媒體傳輸?shù)榷鄠€干擾因素,導(dǎo)致圖像質(zhì)量降低,增加檢測難度。合合信息AIGC圖像鑒別技術(shù)具備了抗攻擊能力強的獨特優(yōu)勢,即使面臨上述干擾也能精準捕捉圖像異常特征。目前,該技術(shù)還可實現(xiàn)毫秒級鑒偽,測試樣本集鑒定準確率超90%,有效識別MidJourney、StableDiffusion、StyleGAN和GPT4O等主流模型生成圖片。
采寫:南都N視頻記者朱可軒發(fā)自上海
免責聲明:本文內(nèi)容由開放的智能模型自動生成,僅供參考。