當前位置：首頁 > 元宇宙 > AI

谷歌推出多模態 VLOGGER AI：讓靜態肖像圖動起來“說話”

來源：責編：時間：2024-03-21 09:43:54 172觀看

導讀 3 月 19 日消息，谷歌近日在 GitHub 頁面發布博文，介紹了 VLOGGER AI 模型，用戶只需要輸入一張肖像照片和一段音頻內容，該模型可以讓這些人物“動起來”，富有面部表情地朗讀音頻內容。VLOGGER AI 是一種適用于虛擬

3 月 19 日消息，谷歌近日在 GitHub 頁面發布博文，介紹了 VLOGGER AI 模型，用戶只需要輸入一張肖像照片和一段音頻內容，該模型可以讓這些人物“動起來”，富有面部表情地朗讀音頻內容。

VLOGGER AI 是一種適用于虛擬肖像的多模態 Diffusion 模型，使用 MENTOR 數據庫進行訓練，該數據庫中包含超過 80 萬名人物肖像，以及累計超過 2200 小時的影片，從而讓 VLOGGER 生成不同種族、不同年齡、不同穿著、不同姿勢的肖像影片。

研究人員表示：“和此前的多模態相比，VLOGGER 的優勢在于不需要對每個人進行訓練，不依賴于人臉檢測和裁剪，可以生成完整的圖像（而不僅僅是人臉或嘴唇），并且考慮了廣泛的場景（例如可見軀干或不同的主體身份），這些對于正確合成交流的人類至關重要”。

Google 將 VLOGGER 視為邁向“通用聊天機器人”的一步，之后 AI 就可以通過語音、手勢和眼神交流以自然的方式與人類互動。

VLOGGER 的應用場景還包括可以用于報告、教育場域和旁白等，也可剪輯既有的影片，如果對影片中的表情不滿意就能加以調整。

附上論文參考

VLOGGER: Multimodal Diffusion for Embodied Avatar Synthesis

本文鏈接：http://www.tebozhan.com/showinfo-45-3644-0.html谷歌推出多模態 VLOGGER AI：讓靜態肖像圖動起來“說話”

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：聯想與英偉達合作，推出全新混合 AI 解決方案

下一篇： Canalys 預估 2025 年 AI PC 占全球 PC 出貨量的 40%

標簽：

熱門焦點

AI網紅能年賺百萬，普通人的新機會來了？

來源｜運營研究社作者 | 張知白編輯 | 楊佩汶設計 | 晏談夢潔2023 年，數字人成為了當紅的“流量話題”和“商業機會"。不管是 AI 孫燕姿走紅網絡，還是 AI 數字
元宇宙時代NFT的價值衡量

有人認為NFT的高昂價格只是炒作的產物，并不具有其對等的價值，但其實NFT并不是空中樓閣，只是區塊鏈數字分類賬中的一種形式。誠然，目前的NFT仍處于灰色地帶，相關的法
2021年中國智慧城市行業概覽：AI慧眼獨具，賦能“雙碳”目標

中國智慧城市試點項目主要集中于東南地區以及華中地區，受制于應用場景分散以及行業地域建設差異，目前中國智慧城市存在較多弊端，未來數量有望持續突破。中國智慧
2022年中國元宇宙產業系列研究報告-基礎設施篇（5）

傳感器是由敏感元件和轉換元件構成，能夠感受規定的檢測量(物理量、化學量、生物量等)，并按照一定規律將檢測量轉化成可用的輸出信號的器件和裝置，進而滿足信息的
全面擁抱“虛擬世界”，摩登天空要打造“音樂元宇宙”

作者：袁佳琦沈黎暉不怎么打游戲，但許多事兒在他眼里都“有意思”。好玩，有意思，是他的口頭禪，在接受娛樂獨角獸的采訪過程中，他多次提到，做虛擬音樂人，“是件挺好玩的
韓國國民銀行將推出韓國首個加密貨幣 ETF

韓國國民銀行(Kookmin Bank)計劃發行該國首個以散戶投資者為主要關注點的加密貨幣投資基金。根據公告，該銀行正在等待政府批準，并已建立一個準備就緒的數字資產
與元宇宙美少女藝術家的對話

我最近宣布了我自己的NFT項目，這是我已經工作了幾個月的事情。由于我之前只是一個收藏家，擁有自己的項目真的給了我一個新的視角來看待這個領域。我一直歡迎人們
用戶可以把自己的醫療健康數據做成NFT出售給醫藥公司掙錢

你可能聽說過不可偽造的代幣，或NFTs。NFTs是數字代幣，代表完全獨特的項目的所有權；存儲在區塊鏈中并可追蹤，它們不能被修改、替換或復制。作為NFT鑄造的資產在數字
在元宇宙開會是什么樣一種體驗

空間就是一切還記得面對面的會議嗎？就在不久前，與會者需要飛到遙遠的目的地，并進行鼓舞人心的對話、網絡、免費食物，甚至可能會有一兩個很好的小組討論。隨之而來

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

谷歌推出多模態 VLOGGER AI：讓靜態肖像圖動起來“說話”

AI網紅能年賺百萬，普通人的新機會來了？

元宇宙時代NFT的價值衡量

2021年中國智慧城市行業概覽：AI慧眼獨具，賦能“雙碳”目標

2022年中國元宇宙產業系列研究報告-基礎設施篇（5）

全面擁抱“虛擬世界”，摩登天空要打造“音樂元宇宙”

韓國國民銀行將推出韓國首個加密貨幣 ETF

與元宇宙美少女藝術家的對話

用戶可以把自己的醫療健康數據做成NFT出售給醫藥公司掙錢

在元宇宙開會是什么樣一種體驗

最新推薦

在數字世界再造世界杯，元宇宙體育正變得越來越豐滿

【量子位】虛擬數字人深度產業報告 | 元宇宙Meta洞見

2022年中國元宇宙系列報告：底層架構研究：虛擬引擎，擎動未來

2030年的元宇宙產業將會如何發展？

美國單曲排行榜Billboard和World of Women合作推出NFT雜志封面

Meta 呼吁行業合作建立元宇宙網絡基礎設施

猜你喜歡

熱門推薦

相關資訊