6 月 21 日消息,快手可靈新功能“圖生視頻”和“視頻續(xù)寫”今日上線。
圖生視頻功能,支持將靜態(tài)圖像轉(zhuǎn)化為 5 秒鐘視頻,用戶可通過提示詞文本控制圖像中物體的運動;視頻續(xù)寫功能,支持對生成視頻一鍵續(xù)寫和連續(xù)多次續(xù)寫,最長可生成約 3 分鐘視頻;此外文生視頻新增 9:16 和 1:1 視頻尺寸選擇。
附快手可靈官方網(wǎng)站:https://kling.kuaishou.com/
可靈是由快手自研打造的視頻生成大模型,能夠生成大幅度的合理運動,模擬物理世界特性。
可靈使用了 DiT 架構(gòu),快手對模型中的隱空間編 / 解碼、時序建模等模塊進行了升維處理。
在隱空間編 / 解碼上,快手自研了 3D VAE 網(wǎng)絡(luò),實現(xiàn)時空同步壓縮,獲得了較高的重建質(zhì)量,在訓(xùn)練性能和效果之間取得了平衡。在時序信息建模上,快手設(shè)計了一款全注意力機制作為時空建模模塊。
本文鏈接:http://www.tebozhan.com/showinfo-45-4748-0.html快手可靈上線圖生視頻與最長 3 分鐘的視頻續(xù)寫功能
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com