作者|江宇
智東西AI前瞻7月9日?qǐng)?bào)道,昨日,AI視頻生成平臺(tái)Vidu正式上線“參考生”功能,支持用戶(hù)通過(guò)上傳人物、場(chǎng)景和道具圖像,一鍵生成造型統(tǒng)一、動(dòng)作自然的高清視頻內(nèi)容。
系統(tǒng)最多可輸入七個(gè)主體圖像,讓人物不“變臉”、場(chǎng)景不混亂,多角色同框和跨場(chǎng)景復(fù)用成為可能。
該功能運(yùn)行于ViduQ1模型之上,支持1080P輸出,無(wú)需用戶(hù)手動(dòng)控制每一幀畫(huà)面,也不依賴(lài)首尾幀設(shè)定,整體生成過(guò)程全部基于圖像設(shè)定自動(dòng)完成。
目前,參考生已在Vidu網(wǎng)頁(yè)端與移動(dòng)端同步上線。
體驗(yàn)指路:https://www.vidu.cn/create
一、上傳圖片,就能拍出連續(xù)鏡頭,還能生成音效
在參考生功能中,用戶(hù)只需上傳一張角色圖像,系統(tǒng)便可識(shí)別人物外觀、服飾、動(dòng)作特征,并自動(dòng)生成5至10秒的視頻片段。畫(huà)面中角色不會(huì)在鏡頭間“變臉”或丟失細(xì)節(jié),人物造型、動(dòng)作風(fēng)格能保持一致。
不僅角色可以設(shè)定,用戶(hù)也可以加入背景圖、道具圖,用于構(gòu)建完整的場(chǎng)景設(shè)定。這些元素將在視頻生成時(shí)一起被識(shí)別,組成統(tǒng)一畫(huà)面。例如,輸入2個(gè)牛仔人物,2個(gè)場(chǎng)景,2把手槍的參考圖,即可生成“西部大片”。
除了畫(huà)面內(nèi)容,Vidu此次也上線了AI音效功能,用戶(hù)只需輸入簡(jiǎn)單描述,即可生成與畫(huà)面匹配的音效片段。
目前支持多個(gè)音效同時(shí)疊加,例如“雨聲+腳步聲+背景音樂(lè)”,并可自動(dòng)適配畫(huà)面節(jié)奏。這一功能降低了創(chuàng)作者在后期配音、尋找素材庫(kù)等環(huán)節(jié)的操作成本,進(jìn)一步向“全流程自動(dòng)生成”方向靠近。
二、人物不變,場(chǎng)景可切,多角色互動(dòng)更自然
參考生也支持將同一個(gè)人物放進(jìn)不同環(huán)境中進(jìn)行生成,這意味著用戶(hù)可以制作“同角色穿越多個(gè)地點(diǎn)”的連續(xù)內(nèi)容。比如在廣告場(chǎng)景中,可用一個(gè)人物設(shè)定,同時(shí)生成多場(chǎng)景版本,更換不同的商拍素材,做出整套素材。
這種方式尤其適合需要統(tǒng)一人物形象的內(nèi)容創(chuàng)作,比如品牌宣傳、IP角色運(yùn)營(yíng)、電商廣告等場(chǎng)景。
在以往,生成這樣一組內(nèi)容通常需要反復(fù)“抽卡式”生成并后期篩選,而現(xiàn)在可一鍵完成。
參考生生成視頻還有一個(gè)明顯的變化:現(xiàn)在可以在一段視頻中加入多個(gè)角色,并讓他們同時(shí)出現(xiàn)在畫(huà)面中。這對(duì)于想要?jiǎng)?chuàng)作對(duì)話類(lèi)短劇、劇情剪輯、甚至IP聯(lián)動(dòng)內(nèi)容的用戶(hù)來(lái)說(shuō),是此前AI工具較難實(shí)現(xiàn)的能力。
系統(tǒng)會(huì)自動(dòng)識(shí)別每個(gè)角色的空間關(guān)系與相對(duì)動(dòng)作,確保多個(gè)角色之間的互動(dòng)看起來(lái)自然、穩(wěn)定。
系統(tǒng)最多支持七個(gè)主體圖像同時(shí)輸入,包括主角、配角、場(chǎng)景、道具等多個(gè)元素。在生成過(guò)程中,系統(tǒng)會(huì)自動(dòng)識(shí)別每個(gè)角色的空間位置與相對(duì)動(dòng)作,確?;?dòng)關(guān)系自然、畫(huà)面結(jié)構(gòu)穩(wěn)定,且各角色在鏡頭切換中保持外觀、造型和細(xì)節(jié)的一致性。
這使得AI視頻創(chuàng)作從“單人獨(dú)白”邁向了更具場(chǎng)景表現(xiàn)力的“多人共演”。
比如讓來(lái)自不同朝代、國(guó)家、地域的三個(gè)人諸葛亮、丘吉爾和拿破侖出現(xiàn)在同一個(gè)會(huì)議室交流。用戶(hù)只需輸入三個(gè)人物圖片素材和相應(yīng)提示詞(“[@諸葛亮]與[@丘吉爾]、[@拿破侖]在會(huì)議室面對(duì)面坐著討論”),即可生成一段三人對(duì)話的視頻。
三、體驗(yàn):畫(huà)面穩(wěn)定、生成提速,圖像還原與動(dòng)作連貫性較好
相比Vidu早期版本,Q1參考生在畫(huà)質(zhì)、穩(wěn)定性和生成效率上均有明顯提升,當(dāng)前版本生成一條5秒的1080P視頻,所需時(shí)間約為1至2分鐘。
在成本方面,該平臺(tái)當(dāng)前定價(jià)為5秒視頻約0.895元,按照基礎(chǔ)套餐估算,1000元可生成約48分鐘的視頻內(nèi)容。
智東西第一時(shí)間對(duì)該功能進(jìn)行了體驗(yàn)。用戶(hù)登錄Vidu平臺(tái)后,可通過(guò)上傳圖片創(chuàng)建“主體角色”,系統(tǒng)將自動(dòng)生成風(fēng)格與描述文本,用戶(hù)可根據(jù)需要進(jìn)行修改或自定義設(shè)定。
此外,還支持上傳背景圖片構(gòu)建自定義場(chǎng)景,平臺(tái)提供基礎(chǔ)裁剪功能輔助畫(huà)面適配。
在本次體驗(yàn)中,智東西選擇了兩張圖像作為輸入,并設(shè)定生成指令為“@安陵容在@圖2奔跑”。上傳完成后,系統(tǒng)自動(dòng)識(shí)別人物姿態(tài)與背景結(jié)構(gòu),幾分鐘內(nèi)即生成視頻成片。
輸出畫(huà)面中,人物造型、服飾細(xì)節(jié)、動(dòng)作流暢度均較為穩(wěn)定,背景融合自然,整體視覺(jué)效果貼近設(shè)定圖像所構(gòu)建的情境。
結(jié)語(yǔ):結(jié)構(gòu)可控、一致性可復(fù)用,AI視頻更實(shí)用
相比以往的圖生視頻、文生視頻產(chǎn)品,ViduQ1參考生的更新讓AI視頻第一次變得“可以反復(fù)使用”。用戶(hù)不再依賴(lài)生成運(yùn)氣或剪輯技巧,只需準(zhǔn)備好圖像,就可以批量輸出結(jié)構(gòu)穩(wěn)定的視頻內(nèi)容。
這對(duì)很多中小型創(chuàng)作者、電商商家、內(nèi)容團(tuán)隊(duì)來(lái)說(shuō),是一次流程的簡(jiǎn)化:不用租攝影棚,不用協(xié)調(diào)演員,也不需要復(fù)雜分鏡,只靠設(shè)定圖就能完成一整套內(nèi)容制作。
接下來(lái),如何生成更長(zhǎng)、更復(fù)雜、更可控的視頻結(jié)構(gòu),會(huì)成為這一類(lèi)產(chǎn)品進(jìn)一步演進(jìn)的方向。但對(duì)當(dāng)前階段的用戶(hù)來(lái)說(shuō),參考生已經(jīng)解決了“生成像不像”和“能不能用”的基本問(wèn)題,這也是一次實(shí)用意義上的進(jìn)化。
小說(shuō):穿越東漢末年,劉溫改亂世,智勇雙全定天下
小說(shuō):重生三國(guó)獲掠奪天賦,搶名將能力,梟雄們懵了!
小說(shuō):重生三國(guó)獲掠奪天賦,名將能力任我取,梟雄們顫抖吧!