衡宇不圓發(fā)自凹非寺量子位|公眾號(hào)QbitAI
夜晚,后院監(jiān)控視角下,10只小兔子在蹦蹦床。
就這么一條時(shí)長(zhǎng)8s、平平無(wú)奇的視頻,在TikTok上單條播放量超過(guò)5億。
大家皺著眉頭反復(fù)觀看:這到底是真實(shí)監(jiān)控視頻畫(huà)面,還是AI生成的?????
起初,量子位編輯部在工位上的朋友們,都被拉過(guò)來(lái)看了至少一遍。
直到有人發(fā)現(xiàn)了華點(diǎn)——
有兩只兔子,蹦著蹦著融合成一只兔子了!
別眨眼,看,就是這里:
我們才確認(rèn)這個(gè)沒(méi)有任何logo水印的視頻,的確由AI生成。
這條欺騙性極強(qiáng)的視頻在TikTok上獲得了5億播放量;隨便搜出一條打假它的視頻,也有700多萬(wàn)播放量。
絕對(duì)是AI視頻里當(dāng)之無(wú)愧的出圈爆款。
“這個(gè)從我后院拍的視頻跟AI有什么關(guān)系?”
兔子的蹦床視頻爆火之后,網(wǎng)上還發(fā)散出了很多紅外監(jiān)控視角下的的其它動(dòng)物的版本。
比如會(huì)莫名原地虛空繁殖的干脆面?zhèn)儯?/p>
比如棕熊……蹦床都被蹦破了啊喂!
你說(shuō)熊熊這么重,跳破蹦床情有可原,但蹦床的碎片怎么飛到一半就消失了?
雖然但是,這些AI動(dòng)物視頻騙過(guò)了很多網(wǎng)友。
甚至有人覺(jué)得,這一定是真實(shí)監(jiān)控畫(huà)面,因?yàn)楝F(xiàn)在AI對(duì)物理的理解還沒(méi)這么好!
有網(wǎng)友看還有很多人不信這是AI出品,干脆“訓(xùn)練”出了一只卡皮巴拉,直接叼著牌牌在鏡頭前友情提示:
這是AI生成的。
其實(shí)只要認(rèn)真盯著看,所有的這些視頻多少都存在些bug。
即使有的視頻里,并沒(méi)有出現(xiàn)動(dòng)物數(shù)量莫名變多或減少,乍一看沒(méi)啥毛病。
但仔細(xì)尋思畫(huà)面里展示出的物理規(guī)律和生物特征,就能慢慢咂摸出不對(duì)勁了。
目前暫時(shí)不清楚背后制作的AI用的是哪一款。
根據(jù)視頻里顯示出的現(xiàn)實(shí)世界的物理理解和展示,大多網(wǎng)友猜測(cè),這些AI視頻大概率是使用Veo3生成的。
我們自己也試著用Veo3生成了一個(gè)“兔子蹦床”的視頻。
Maybe因?yàn)闆](méi)有原版提示詞,最終效果沒(méi)有網(wǎng)上那些視頻那么逼真,但也足以混淆視聽(tīng)——
有些圍觀網(wǎng)友坐不住了,連夜想要學(xué)習(xí):“如果有人能教一下怎么讓視頻更逼真就好了”。
更多的人心懷擔(dān)憂:
如果AI視頻真的開(kāi)始以假亂真了,我們?cè)趺捶直胬铄雍屠罟?、孫悟空和六耳獼猴呢?
短短一年半,AI視頻從“笑死我”到“詐騙我”
就目前的AI視頻生成效果而言,大多數(shù)時(shí)候,咱碳基生物還是能很快發(fā)現(xiàn)它不是真實(shí)拍攝而成的。
但,這次的蹦床視頻為什么就蒙蔽了那么多人的眼睛?
首先,模仿夜間紅外監(jiān)控畫(huà)質(zhì),AI占了大便宜。
紅外監(jiān)控視頻本身的低清晰度其實(shí)是一種天然遮羞布。
它所拍攝的視頻多為灰度影像,細(xì)節(jié)粗糙、畫(huà)質(zhì)模糊、噪點(diǎn)明顯——這就天然降低了觀眾對(duì)真實(shí)與否的懷疑。
AI生成視頻在高分辨率環(huán)境下容易暴露破綻,很容易被看出物理邏輯不通、動(dòng)作失真、邊緣異常等等。
但如果你只需要模仿一個(gè)本來(lái)就只有480p的監(jiān)控?cái)z像頭畫(huà)面,甚至畫(huà)面里還有抖動(dòng)、拖影、壓縮馬賽克,這些瑕疵反而掩蓋了AI效果的缺陷。
其次,題材選得也非常好。
如果是真人蹦床,可能刷到的朋友們很快就劃過(guò)去了……
但如果是各式各樣的小動(dòng)物在夜間偷偷潛入你的后院,在蹦床上嗨,更有可能引得大家停下來(lái)多看兩眼。
“深夜”“監(jiān)控”“后院”貼近生活,“動(dòng)物蹦床”又有點(diǎn)獵奇。
最重要的是,現(xiàn)在第一梯隊(duì)AI視頻工具的生成效果,有時(shí)候真的可以以假亂真了!
遙想2023年3月,AI生成的“威爾史密斯吃面”突然在Reddit上爆火。
畫(huà)面中,AI生成的威爾·史密斯正吃著意大利面,但動(dòng)作非常僵硬,咀嚼過(guò)程不自然,甚至還有面條穿過(guò)嘴巴的詭異現(xiàn)象,總之非常詭異又讓人上頭。
這其實(shí)是外國(guó)網(wǎng)友用阿里當(dāng)時(shí)出的modelscope-text-to-video-synthesis視頻合成大模型所做。
想不到哇想不到,AI視頻生成從詭異畫(huà)風(fēng)到以假亂真,從3s一閃而過(guò)到10s也手拿把掐,也就才過(guò)了2年時(shí)間——
說(shuō)實(shí)在話,2年時(shí)間并沒(méi)有很久,只是光陰似箭,AI進(jìn)展如梭。
OneMoreThing
最后貼心為大家送上2個(gè)識(shí)別是否是AI視頻的小tips~
不用找畫(huà)面里有沒(méi)有AI工具的logo,也不用仔細(xì)盯著視頻看有沒(méi)有違背物理原理的畫(huà)面出現(xiàn)。
只用兩招邪修大法:
一看視頻博主帶沒(méi)帶AI相關(guān)的tag。
二嘛,現(xiàn)在頂尖水平的AI,國(guó)外Veo3、國(guó)內(nèi)Kling等,單條視頻最長(zhǎng)時(shí)長(zhǎng)不超過(guò)10s。
你學(xué)廢了嘛?(手動(dòng)狗頭)
參考鏈接:[1]https://www.reddit.com/r/ChatGPT/comments/1me4qgv/bunnies_on_a_trampoline_half_a_billion_views/[2]https://www.tiktok.com/@polluxtea/video/7532505883838778680[3]https://www.tiktok.com/search?q=bunnies%20on%20trampoline&t=1754004663912[4]https://x.com/GZhan57/status/1950969713984676329[5]https://x.com/kimmonismus/status/1951002671374278983
那些令人捧腹大笑的笑話(二)