7 月 4 日消息,商湯科技在世界人工智能大會(WAIC)上發(fā)布了首個“可控”人物視頻生成大模型 Vimi,通過一張任意風(fēng)格的照片就能生成和目標動作一致的人物類視頻,并支持多種驅(qū)動方式,可通過已有人物視頻、動畫、聲音、文字等多種元素進行驅(qū)動。
與圖片表情控制類技術(shù)只能控制頭部表情動作不同,商湯稱 Vimi 不但可以實現(xiàn)精準的人物表情控制,還可實現(xiàn)在半身區(qū)域內(nèi)控制照片中人物的自然肢體變化,并自動生成與人物相符的頭發(fā)、服飾及背景變化。
同時 Vimi 可穩(wěn)定生成 1 分鐘的單鏡頭人物類視頻,畫面效果不會隨著時間的變化而劣化或失真,滿足娛樂互動等需要長時間穩(wěn)定視頻生成需求。
Vimi 將完全面向 C 端用戶開放使用,用戶只需上傳不同角度的高清人物圖片,即可自動生成數(shù)字分身和不同風(fēng)格的寫真視頻。
由 Vimi 生成的視頻人物不再只是呆板的五官運動,而是搭配手勢、肢體、頭發(fā)等,形成更完整、統(tǒng)一的人物動作,讓創(chuàng)作者可基于生成的視頻素材進行剪輯和再創(chuàng)作。
商湯表示將在明日公布 Vimi 的更多細節(jié),也會持續(xù)關(guān)注并帶來跟進報道。
本文鏈接:http://www.tebozhan.com/showinfo-45-4969-0.html一張照片創(chuàng)造 1 分鐘人物視頻,商湯發(fā)布首個“可控”人物視頻生成大模型 Vimi
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com