當前位置：首頁 > 元宇宙 > AI

讓蒙娜麗莎唱饒舌，微軟發(fā)布 VASA-1 模型：圖 + 音頻可生成短視頻

來源：責編：時間：2024-04-26 08:44:07 150觀看

導(dǎo)讀 4 月 19 日消息，微軟亞洲研究院（Microsoft Research Asia）近日發(fā)表論文，介紹了全新的 VASA-1 模型，用戶只需要提供一張靜態(tài)肖像圖片和一段語音音頻片段，該模型就能自動讓圖片中的人物自動說話。VASA-1 特別有趣的地

4 月 19 日消息，微軟亞洲研究院（Microsoft Research Asia）近日發(fā)表論文，介紹了全新的 VASA-1 模型，用戶只需要提供一張靜態(tài)肖像圖片和一段語音音頻片段，該模型就能自動讓圖片中的人物自動說話。

VASA-1 特別有趣的地方在于，它能夠模擬自然的面部表情、各種情緒和唇部同步，最重要的是幾乎沒有人工痕跡，如果不細看很難發(fā)現(xiàn)。

研究人員承認，與所有其他模型一樣，該模型目前還無法妥善處理頭發(fā)等非剛性元素，但整體效果要比其它同類模型要更為優(yōu)秀。

研究人員還表示 VASA-1 支持離線 batch 處理模式下，以 45fps 生成分辨率為 512*512 的動態(tài)短視頻，在線直播模式下可以達到 40 fps，且延遲僅為 170ms。而且整個生成操作只需要一臺配備英偉達 RTX 4090 顯卡的電腦上就能處理。

附上參考地址

New VASA-1 model by Microsoft Research Asia

VASA-1: Lifelike Audio-Driven Talking Faces Generated in Real Time

本文鏈接：http://www.tebozhan.com/showinfo-45-4111-0.html讓蒙娜麗莎唱饒舌，微軟發(fā)布 VASA-1 模型：圖 + 音頻可生成短視頻

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：五糧液濃香酒：勞動節(jié)送禮的精致藝術(shù)

下一篇：谷歌整合 Research 和 DeepMind 資源，全力發(fā)展 AI

標簽：

熱門焦點

亞馬遜AIGC全家桶來襲，巨頭AI大亂戰(zhàn)都有什么殺手锏

此前，亞馬遜云科技發(fā)布多款A(yù)IGC產(chǎn)品，其中包括AI大模型服務(wù)Amazon Bedrock、人工智能計算實例Amazon EC2 Trn1n和Amazon EC2 Inf2、自研“泰坦”（Titan）AI大模型、軟件
元宇宙火熱的當下，我們該如何“身臨其境”的體驗元宇宙？

元宇宙的余熱依然沒有過去，甚至大有星星之火開啟燎原之勢，元宇宙本身也從殿堂走向了民間，我們可以看到一些企業(yè)開始了元宇宙的探索，諸如中國電信全資控股子公司天
有人狂賺千倍，資金盤游戲日進上億，元宇宙泡沫還能吹多久？

你還不知道元宇宙？沒關(guān)系。看看微軟、Meta、英偉達的雄心壯志，便可領(lǐng)略元宇宙的遼闊。1月18日，微軟宣布將以687億美元收購動視暴雪，這是有史以來互聯(lián)網(wǎng)領(lǐng)域最大的
索尼公布PSVR 2頭顯渲染圖；社區(qū)開發(fā)者發(fā)布Quest版《我的世界》

近日熱點：索尼正式公布PSVR 2頭顯及控制器官方渲染圖；入局元宇宙，鴻海科技與XRSPACE簽訂合作備忘錄；研究人員表示面部追蹤可增強VR操控體驗；社區(qū)開發(fā)者QuestCraft發(fā)
吸金31億美元，誰在催火2021年的鏈游？

2021年究竟發(fā)生了什么，才使得鏈游領(lǐng)域在這年一飛沖天？作者：廖羽2022年2月16日，Invest Game發(fā)布《2021年全球游戲投資報告》，報告顯示，游戲行業(yè)的投資重點正在向區(qū)塊
全面擁抱“虛擬世界”，摩登天空要打造“音樂元宇宙”

作者：袁佳琦沈黎暉不怎么打游戲，但許多事兒在他眼里都“有意思”。好玩，有意思，是他的口頭禪，在接受娛樂獨角獸的采訪過程中，他多次提到，做虛擬音樂人，“是件挺好玩的
NFT藝術(shù)家Hayley Rincon 專訪：我的迷幻數(shù)字藝術(shù)之路

Hayley Rincon是一位令人印象深刻才華橫溢的創(chuàng)作者，她的作品呈現(xiàn)出迷幻的氣息。今天就來聊聊她的藝術(shù)作品，和她自己的數(shù)字藝術(shù)之路。Hayley是加利福尼亞灣區(qū)的有
又一家數(shù)字營銷公司入局元宇宙，國內(nèi)首個藝術(shù)元宇宙社區(qū)“Meta彼岸”上線

作者：董宇佳2月28日，智度股份在北京舉辦產(chǎn)品發(fā)布會，宣布其與國光電器聯(lián)手打造的國內(nèi)首個藝術(shù)元宇宙社區(qū)——“Meta彼岸”在VR端和移動端正式公測。從科技巨頭布局
虛擬鄧麗君后，數(shù)字人賽道開啟3.0時代

“如果右腦時代來臨，虛擬世界將是對人類才華的無限放大。” 郭曉喆稱，開發(fā)數(shù)字人形象時，自己的團隊在內(nèi)部“卷”了一下：“當我們翻閱大量歷史典籍的時候，蘇小妹找到

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

讓蒙娜麗莎唱饒舌，微軟發(fā)布 VASA-1 模型：圖 + 音頻可生成短視頻

亞馬遜AIGC全家桶來襲，巨頭AI大亂戰(zhàn)都有什么殺手锏

元宇宙火熱的當下，我們該如何“身臨其境”的體驗元宇宙？

有人狂賺千倍，資金盤游戲日進上億，元宇宙泡沫還能吹多久？

索尼公布PSVR 2頭顯渲染圖；社區(qū)開發(fā)者發(fā)布Quest版《我的世界》

吸金31億美元，誰在催火2021年的鏈游？

全面擁抱“虛擬世界”，摩登天空要打造“音樂元宇宙”

NFT藝術(shù)家Hayley Rincon 專訪：我的迷幻數(shù)字藝術(shù)之路

又一家數(shù)字營銷公司入局元宇宙，國內(nèi)首個藝術(shù)元宇宙社區(qū)“Meta彼岸”上線

虛擬鄧麗君后，數(shù)字人賽道開啟3.0時代

最新推薦

在數(shù)字世界再造世界杯，元宇宙體育正變得越來越豐滿

中國區(qū)塊鏈產(chǎn)業(yè)生態(tài)地圖報告（2021）

2022年的Web3：定義概念并開創(chuàng)新范式

從冰墩墩到無聊猿，解秘未來IP爆款的模因

元宇宙是數(shù)字共識生態(tài)的集成邏輯表達

大廠打造元宇宙平臺的業(yè)務(wù)重心是什么？

猜你喜歡

熱門推薦

相關(guān)資訊