當前位置：首頁 > 元宇宙 > AI

科學家開發 DIRFA：輸入圖片和音頻，可生成說話視頻

來源：責編：時間：2023-11-21 09:37:46 289觀看

導讀 11 月 17 日消息，來自新加坡南洋理工大學（NTU Singapore）的科研團隊近日開發出了 DIRFA 工具，用戶給一張圖片以及音頻內容，可以自動生成 3D 視頻，并實現口型和聲音的同步協調。DIRFA 的全稱為 DIverse yet Realisti

11 月 17 日消息，來自新加坡南洋理工大學（NTU Singapore）的科研團隊近日開發出了 DIRFA 工具，用戶給一張圖片以及音頻內容，可以自動生成 3D 視頻，并實現口型和聲音的同步協調。

DIRFA 的全稱為 DIverse yet Realistic Facial Animations，訓練了超過 6000 多人的 100 萬個視頻片段，音頻片段來自一個名為 VoxCeleb2 數據集的開源數據庫，并關聯面部表情和頭部運動。

研究人員表示，DIRFA 可能會在包括醫療保健在內的各個行業和領域帶來新的應用，因為它可以實現更復雜和逼真的虛擬助手和聊天機器人，從而改善用戶體驗。

DIRFA 還可以作為言語或面部殘疾人士的強大工具，幫助他們通過富有表現力的頭像或數字表示來傳達他們的想法和情感，從而增強他們的溝通能力。

附上論文參考地址：Rongliang Wu, Yingchen Yu, Fangneng Zhan, Jiahui Zhang, Xiaoqin Zhang, Shijian Lu.Audio-driven talking face generation with diverse yet realistic facial animations.Pattern Recognition, 2023; 144: 109865 DOI:10.1016/j.patcog.2023.109865

本文鏈接：http://www.tebozhan.com/showinfo-45-2607-0.html科學家開發 DIRFA：輸入圖片和音頻，可生成說話視頻

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： 27 億參數，微軟發布 Phi-2 模型：某些性能指標優于 Llama-2-7B

下一篇：谷歌將“水印”嵌入人工智能生成的音樂中，人耳無法察覺

標簽：

熱門焦點

AI網紅能年賺百萬，普通人的新機會來了？

來源｜運營研究社作者 | 張知白編輯 | 楊佩汶設計 | 晏談夢潔2023 年，數字人成為了當紅的“流量話題”和“商業機會"。不管是 AI 孫燕姿走紅網絡，還是 AI 數字
元宇宙火熱的當下，我們該如何“身臨其境”的體驗元宇宙？

元宇宙的余熱依然沒有過去，甚至大有星星之火開啟燎原之勢，元宇宙本身也從殿堂走向了民間，我們可以看到一些企業開始了元宇宙的探索，諸如中國電信全資控股子公司天
【申萬宏源】必然的碎片化AI落地，哪種路徑可能勝出？ | 元宇宙Meta洞見

大規模預訓GPT(Generative PreTraining)是OpenAI在2018年提出的模型，大規模預訓練模型（大模型）漸漸成為了AI算法領域的熱點。AI產業鏈：從算力到應用工作流程視角?
Meta證實Quest 2無法實現全身追蹤，未來將為虛擬化身配備“假腿”

上周，外媒UploadVR在Quest 2開發者文檔中發現了從未被公布過的“身體追蹤支持”選項，暗示Meta VR頭顯或支持全身追蹤。而在最近的Instagram問答環節中，Meta Reali
Shiba Inu布局元宇宙走出Meme局限

以「狗狗幣殺手」成名的Shiba Inu（SHIB）在人們的印象中始終有著濃厚的Meme（模因惡搞）烙印，但它似乎一直在嘗試突破這種局限。建立起一個龐大的粉絲社區后，Shiba Inu
重溫 1602 年：DAO 是新的企業范式嗎？

作者：Andrew Singer“ 將你的選票委托給行業有能力的專家，將使所有者在這些公司的管理中擁有更強大、更清晰的話語權。”1602 年，荷蘭東印度公司成立，許多人認為
就業年齡歧視如何解決？來Web3看看

上周，我突然想到我的第一份工作實際上是在為一家失敗的航空公司制定破產退出計劃，那年我們的協議實習生剛出生。在一陣恐慌后，我又花了一點時間反思我這個擁有近1
韓國流行音樂巨頭SM與Binance達成NFT合作伙伴關系

韓國流行音樂巨頭 SM Entertainment 與加密貨幣交易所 Binance（幣安）達成“Play2Create”NFT 合作伙伴關系。SM 娛樂一直在投資打造元宇宙該公司于 2020 年 10
虛擬人行業研究報告

最早的虛擬人出現于 20 世紀 80 年代，受限于技術，當時的虛擬人制作以手繪為主。21 世紀初，隨著動捕、渲染等技術的逐步發展，虛擬人相關技術開始在影視領域逐漸普及

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

科學家開發 DIRFA：輸入圖片和音頻，可生成說話視頻

AI網紅能年賺百萬，普通人的新機會來了？

元宇宙火熱的當下，我們該如何“身臨其境”的體驗元宇宙？

【申萬宏源】必然的碎片化AI落地，哪種路徑可能勝出？ | 元宇宙Meta洞見

Meta證實Quest 2無法實現全身追蹤，未來將為虛擬化身配備“假腿”

Shiba Inu布局元宇宙走出Meme局限

重溫 1602 年：DAO 是新的企業范式嗎？

就業年齡歧視如何解決？來Web3看看

韓國流行音樂巨頭SM與Binance達成NFT合作伙伴關系

虛擬人行業研究報告

最新推薦

10億基金，李彥宏呼喚下一個AI獨角獸

數字人的新革命，BAT的“沖高”戰場

“元宇宙”里過大年，《迷你世界》在做一場怎樣的實驗？

NFT Insider #47：YGG發布2021Q4社區報告，GameFi領域1月份獲超10億美元融資

a16z：元宇宙辦公會取代實體辦公室嗎？

全球十大元宇宙概念游戲

猜你喜歡

熱門推薦

相關資訊