當前位置：首頁 > 元宇宙 > AI

Meta 推出 AI 音頻模型 Audiobox：支持語音及文字同時輸入、可生成多層次聲音

來源：責編：時間：2023-12-08 09:12:31 305觀看

導讀 12 月 4 日消息，Meta 日前推出了一款 AI 聲音生成模型 Audiobox，能夠同時接收語音及文字輸入，用戶可同時使用語音及文字描述，讓這款模型生成所需的音頻。據悉，這款模型基于 Meta 今年 6 月推出的 Voicebox AI 模型

12 月 4 日消息，Meta 日前推出了一款 AI 聲音生成模型 Audiobox，能夠同時接收語音及文字輸入，用戶可同時使用語音及文字描述，讓這款模型生成所需的音頻。

據悉，這款模型基于 Meta 今年 6 月推出的 Voicebox AI 模型，據稱 Audiobox 能生成各種環境音、自然對話語音，并整合了音頻生成和編輯能力，以便于用戶自由生成自己所需的音頻。

Meta 介紹稱，生成高品質音頻需要有大量音頻庫及深厚的領域知識，但大眾難以獲得這些資源，而該公司推出這個模型旨在降低聲音生成門檻，讓任何人都更容易制作視頻、游戲等應用場景的音效。

發現，這款 Audiobox 模型基于 Voicebox 的“引導聲音”機制，以便于生成目標音頻，并配合“流量比對（flow-matching）”擴散模型生成方法，以實現“聲音填充（audio infilling）”功能，從而生成多層次的音頻。

Meta 測試生成帶有雷暴聲的下雨音頻，并輸入一系列提示句進行演示，例如“流水聲伴隨鳥鳴”、“以高音調快節奏說話的年輕女性”等；同時測試了同時輸入人聲及文字提示，以生成帶有情緒（“哀痛而緩慢”）并擁有背景音（身處教堂）的語音。

Meta 聲稱，Audiobox 在音質及“生成內容的準確度” 順利擊敗了 AudioLDM2、VoiceLDM 及 TANGO，超越了現有最佳的音頻生成模型。

目前 Audiobox 已經開放向特定研究人員及學術界試用，以供測試模型品質及安全性，Meta 聲稱，他們計劃“再過幾周將社會全面公開該模型”。

本文鏈接：http://www.tebozhan.com/showinfo-45-2805-0.htmlMeta 推出 AI 音頻模型 Audiobox：支持語音及文字同時輸入、可生成多層次聲音

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：微軟僅憑「提示工程」讓 GPT-4 成醫學專家！超過一眾高度微調模型，專業測試準確率首次超 90%

下一篇：雙11錯過的大眼橙投影儀優惠，雙12繼續低價購！

標簽：

熱門焦點

《從營銷AIGC化到AIGC營銷化》報告發布

來源：清元宇宙7月2日上午，清華大學元宇宙文化實驗室舉辦元宇宙在線沙龍“AIGC熱潮與應用”。會議中，清華大學新聞與傳播學院教授、元宇宙文化實驗室主任、新媒體研究
藍標虧錢、Meta裁員：天下秀還值得砸錢元宇宙嗎？

日前，天下秀數字科技集團正式公布了2022年報及2023年一季報。報告顯示，2022年天下秀實現營收41.29億元，同比下滑8.48%；歸母凈利潤1.8億元，同比下滑49.2%，幾乎出現了盈利腰斬的態勢
元宇宙步入暗夜

撰文 | 文燁豪元宇宙的故事，似乎講不通了。當下，刮起元宇宙熱潮的Roblox股價已跌去大半，帶頭大哥Meta也正因元宇宙虧損深陷泥潭。再看國內，從字節“派對島&
元宇宙火熱的當下，我們該如何“身臨其境”的體驗元宇宙？

元宇宙的余熱依然沒有過去，甚至大有星星之火開啟燎原之勢，元宇宙本身也從殿堂走向了民間，我們可以看到一些企業開始了元宇宙的探索，諸如中國電信全資控股子公司天
Layer1的新以太坊，更好的以太坊？

以太坊作為區塊鏈基礎設施地位看起來已不可動搖，但也面臨著費用高、效率低、偏離去中心化初衷等問題。平臺上既得利益群體的形成和固化也逐漸讓革新變得困難。
頂流IP“冰墩墩”帶著中國元素NFT進入全球視野

一場被國際奧委會主席評價堪稱獨具匠心、非凡卓越的2022年北京冬季奧運會，在這個“雙奧之城”經歷了16個令人難忘的精彩日夜，最終圓滿閉幕。讓我們印象深刻的不
音樂家如何利用NFTs來提高歌迷參與度

"音樂是一種語言，不以特定的文字說話。它用情感說話，如果它在骨子里，它就在骨子里。" - Keith Richards音樂激勵著我們，使我們流淚，使我們充滿狂喜，并撫慰我們的靈魂
大廠打造元宇宙平臺的業務重心是什么？

知名市場研究機構IDC發布《2022年中國元宇宙市場十大預測》報告，其中提出互聯網大廠各自獨立布局元宇宙平臺。事實上，在2021年的最后一個季度，包括Meta、英偉達、
冬奧會數字收藏品升溫，市場再現“一墩難求”

根據公開信息顯示，國際奧委會官方授權的冰墩墩數字盲盒于北京時間2月12日凌晨在nWayPlay平臺發售，總數為500個，每個99美元，每人限購5個。此外，不同的奧運徽章數字藏

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

Meta 推出 AI 音頻模型 Audiobox：支持語音及文字同時輸入、可生成多層次聲音

《從營銷AIGC化到AIGC營銷化》報告發布

藍標虧錢、Meta裁員：天下秀還值得砸錢元宇宙嗎？

元宇宙步入暗夜

元宇宙火熱的當下，我們該如何“身臨其境”的體驗元宇宙？

Layer1的新以太坊，更好的以太坊？

頂流IP“冰墩墩”帶著中國元素NFT進入全球視野

音樂家如何利用NFTs來提高歌迷參與度

大廠打造元宇宙平臺的業務重心是什么？

冬奧會數字收藏品升溫，市場再現“一墩難求”

最新推薦

茅臺的元宇宙App火了，也被罵慘了

城市數字孿生標準化白皮書（2022版）

上海虹口成立10億元元宇宙基金，香港首只元宇宙ETF擬上市

從冰墩墩到無聊猿，解秘未來IP爆款的模因

虛擬數字人：元宇宙的主角破圈而來

過去女性在互聯網領域是半邊天，在Web3，將會是整片天！

猜你喜歡

熱門推薦

相關資訊

Meta 推出 AI 音頻模型 Audiobox：支持語音及文字同時輸入、可生成多層次聲音

最新推薦

猜你喜歡

熱門推薦

相關資訊

Meta 推出 AI 音頻模型 Audiobox：支持語音及文字同時輸入、可生成多層次聲音