3 月 29 日消息,清華大學人工智能研究院副院長、生數科技創始人兼首席科學家朱軍今日發布了高可控視頻大模型 Vidu Q1,官方宣稱其為業內首個高可控 AI 視頻大模型。
從官方獲悉,Vidu Q1 在多主體細節可控(特別是動作、布局可控)、音效同步可控、畫質增強等方面均取得顯著成效。以多主體細節可控為例,在語義指令的基礎上,通過融入參考圖的視覺指令,Vidu Q1 支持對場景中多主體的位置、大小、運動軌跡等屬性進行更進一步的可控,對所有動作行為(出場、退場、坐立姿態、行動路線)進行精準調整。
其支持音效同步可控功能,可確保隨著視頻環境與畫面轉場,Vidu Q1 能夠輸出生成相應音效,并可精準控制每段音效的長短區間,精準設置每段音頻出現的時間點,如 0-2s 風聲、3-5s 雨聲等。
本文鏈接:http://www.tebozhan.com/showinfo-45-11800-0.html生數科技發布高可控視頻大模型 Vidu Q1:可精準調整所有動作行為
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com