4 月 21 日消息,昆侖萬維今日正式發(fā)布并開源 SkyReels-V2—— 全球首個使用擴散強迫(Diffusion-forcing)框架的無限時長電影生成模型,其通過結合多模態(tài)大語言模型(MLLM)、多階段預訓練(Multi-stage Pretraining)、強化學習(Reinforcement Learning)和擴散強迫(Diffusion-forcing)框架來實現(xiàn)協(xié)同優(yōu)化。官方表示,該模型將突破視頻生成技術邊界,開啟“無限時長電影生成”新時代。
附開源地址如下:
SkyReels-V2GitHub 地址:https://github.com/SkyworkAI/SkyReels-V2
論文地址:https://arxiv.org/abs/2504.13074
SkyReels-A2HuggingFace 地址:https://huggingface.co/ Skywork / SkyReels-A2
GitHub 地址:https://github.com/SkyworkAI/SkyReels-A2
論文地址:https://arxiv.org/ pdf/2504.02436
據介紹,現(xiàn)有技術在提升穩(wěn)定的視覺質量時往往犧牲運動動態(tài)效果,為了優(yōu)先考慮高分辨率而限制視頻時長(通常為 5-10 秒),并且由于通用多模態(tài)大語言模型(MLLM)無法解讀電影語法(如鏡頭構圖、演員表情和攝像機運動),導致鏡頭感知生成能力不足。這些相互關聯(lián)的限制阻礙了長視頻的逼真合成和專業(yè)電影風格的生成。
為此應運而生的 SkyReels-V2 則在技術上實現(xiàn)了突破,還提供了多種有用的應用場景,包括故事生成、圖生視頻、運鏡專家和多主體一致性視頻生成(SkyReels-A2)。
SkyReels-V2 現(xiàn)已支持生成 30 秒、40 秒的視頻,且具備生成高運動質量、高一致性、高保真視頻的能力。
官方表示,SkyReels-V2 在運動動態(tài)方面表現(xiàn)優(yōu)異,能夠生成流暢且逼真的視頻內容,滿足電影制作中對高質量運動動態(tài)的需求。
本文鏈接:http://www.tebozhan.com/showinfo-45-12530-0.html昆侖萬維開源 SkyReels-V2 模型,開啟生成“無限時長”視頻時代
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com