虛擬數(shù)字人行業(yè)未來的主要驅動力包括:用戶代際變化,新一代消費者對內容消費和虛擬世界更為渴求;虛擬數(shù)字人相關技術門檻相對降低,成本有所回落;資本熱度上升,受Metaverse概念和國外成功廠商引導,虛擬化的趨勢逐漸成為共識;VR眼鏡等相關配套設備逐漸回暖,有望實現(xiàn)大規(guī)模商用。
● 定義
虛擬數(shù)字人指存在于非物理世界中,由計算機圖形學、圖形渲染、動作捕捉、深度學習、語音合成等計算機手段創(chuàng)造及使用,并具有多重人類特征的綜合產物。市面上也多將其稱為為虛擬形象、虛擬人、數(shù)字人等,代表性的細分應用包括虛擬助手、虛擬客服、虛擬偶像/主播等。
● 技術細節(jié)
(1)設計形象
掃描真人形態(tài)及表演、采集驅動數(shù)據(jù)利用多方位攝像頭,對通用/特定模特進行打點掃描,采集其說話時的唇動、表情、面部肌肉變化細節(jié)、姿態(tài)等數(shù)據(jù)。
(2)形象建模
進行綁定設計所需的模型,或基于特定真人進行高還原度建模,進行關鍵點綁定,關鍵點綁定的數(shù)量及位置影響最終效果。
(3)訓練各類驅動模型
決定最終效果的核心步驟利用深度學習,學習模特語音、唇形、表情參數(shù)間的潛在映射關系,形成各自的驅動模型與驅動方式。
(4)內容制作
基于輸入的語音,預測唇動、表情等參數(shù)核心的技術流程是基于輸入的語音,或首先基于TTS技術,將輸入的本文轉化為語音。
(5)進行渲染,生成最終內容
直播時進行實時渲染為保證在特定場景下能夠實現(xiàn)實時低延遲渲染,計算框架的大小、算力供給等技術問題同樣會影響到虛擬數(shù)字人的最終生成效果。
● 市場規(guī)模
經過測算,我們認為,在2030年,我國虛擬數(shù)字人整體市場規(guī)模將達到2700億。其中,得益于虛擬IP的巨大潛力,以及虛擬第二分身的起步,身份型虛擬數(shù)字人將占據(jù)主導地位,約1750億,并逐步成為Metaverse中的重要一環(huán)。
● 行業(yè)發(fā)展階段
相芯科技基于自身認知,將虛擬數(shù)字人的未來發(fā)展劃分為三個階段。
(1)B端行業(yè)探索與教育的成長期
該階段主要用于完善行業(yè)解決方案,同時通過2B2C對C端客戶進行市場教育。
(2)B端場景成熟向C端滲透的發(fā)展期
該階 段B端應用場景將與行業(yè)深度結合,逐漸成熟。同時廠商開始關注UGC,消費級工具、C端消費訂閱制、虛擬內容生產迎來井噴。
(3)技術迭代的成熟期
B、C端應用成熟,并形成數(shù)字資產及經濟體系。
● 細分場景及相關判斷
(1)服務型虛擬數(shù)字人
目前,國內的服務型虛擬數(shù)字人主要用于替代真人進行播報等內容生成,并進行簡單問答交互等。
(2)身份型虛擬數(shù)字人
與缺乏人格象征的服務型虛擬數(shù)字人相比,身份型虛擬數(shù)字人更強調其本身的身份。
● 進入門檻及行業(yè)瓶頸
在追一科技等廠商看來,技術是進入行業(yè)的核心門檻,需要進入玩家在機器視覺、語音交互和自然語言處理方面都具有深厚的技術積累,并將三者進行有機結合。
無論在國內還是國外,虛擬數(shù)字人的競爭格局都尚未成熟,行業(yè)集中度相對較高。盡管玩家數(shù)量在快速增長,但由于行業(yè)對綜合的技術實力和合作渠道能力要求較高,具有相當實力的頭部公司仍相對有限。
-END-
本文鏈接:http://www.tebozhan.com/showinfo-40-72-0.html【量子位】虛擬數(shù)字人深度產業(yè)報告 | 元宇宙Meta洞見
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
下一篇: 中文在線的“元宇宙”故事,資本聽膩了?