3 月 21 日消息,Stability AI 近日發布了 Stable Video 3D 模型,該模型可從單張圖像創建多視圖 3D 視頻。
Stable Video 3D 包含兩個變體,其中 SV3D_u 能基于單個圖像輸入生成軌道視頻,無需相機調節;而 SV3D_p 擴展了 SVD3_u 的功能,其可容納軌道視圖,允許沿著指定的攝像機路徑創建 3D 視頻。
相較之前的 Stable Zero123 模型或開源替代品 Zero123-XL,Stable Video 3D 在質量上有明顯提高,并具有更好的多視圖功能和更熟練的泛化能力,能更忠實地展現輸入圖像的三維全貌。
Stability AI 表示,新模型的水平提升有賴于其基石 Stable Video Diffusion 模型,同時 Stable Video 3D 添加了攝像機路徑調節,可生成圍繞物體的任意軌道。
Stable Video 3D 利用其多視圖一致性來優化 3D NeRF 和網格表示,以提高直接從新視圖生成的 3D 網格的質量。
為此 Stability AI 設計了一種新的掩碼分數蒸餾采樣損失技術,可提高 3D 預測質量。同時其解糾纏照明優化也減少了照明問題,提升了陰影質量。
Stability AI 表示 Stable Video 3D 已可通過其 Stability AI 會員訂閱(注:對于一般個人每月 20 美元)商業使用;而對于非商業用途,則可在 Hugging Face 平臺上下載模型權重。
本文鏈接:http://www.tebozhan.com/showinfo-45-3679-0.html可從單張圖像創建多視圖 3D 視頻,Stability AI 發布 Stable Video 3D 模型
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com