當前位置：首頁 > 元宇宙 > AI

李飛飛團隊實現“隔空建模”，透過遮擋物還原完整 3D 人體模型

來源：責編：時間：2024-01-15 09:18:10 259觀看

導讀注意看，這個男人搬著一個長長的柜子，畫面中半個人都被遮擋住了。但即使有這樣的遮擋，男人的整個身體在 AI 面前依然是無所遁形。哪怕是蹲在椅子背后只露出頭，依然可以被模型完整還原。從遮擋物背后把人“揪”出來

注意看，這個男人搬著一個長長的柜子，畫面中半個人都被遮擋住了。

但即使有這樣的遮擋，男人的整個身體在 AI 面前依然是無所遁形。

哪怕是蹲在椅子背后只露出頭，依然可以被模型完整還原。

從遮擋物背后把人“揪”出來的，是李飛飛團隊推出的人體建模新工具 Wild2Avatar（本文簡稱 W2A）。

只要一段 4 秒左右的單角度視頻，就能構建出完整的 3D 模型，有遮擋也不怕。

相比此前的 SOTA 方法，Wild2Avatar 在人體建模上可謂是實現了質的飛躍。

建模效果完勝 Vid2Avatar

從下面的對比圖中（從左到右依次為帶遮擋原圖、Vid2Avatar 提取結果和 W2A 提取結果）可以看到，作為 baseline 的 Vid2Avatar 方法只能大概描繪出人的輪廓，遮擋物直接被“拍扁”到了人物身上，而且輪廓看上去也不夠準確。

而 W2A 提取出的任務不僅輪廓更加精確，看上去也更具立體感，關鍵是遮擋物被完美地去除，顯現出了完整的人物結構。

對遮擋物的去除，W2A 操作得也更為徹底，沒有留下多余的痕跡。

而 baseline 中部分結構缺失的現象，在 W2A 中也沒有發生，人物的結構十分完整。

而且，W2A 的人物建模是動態的，視頻畫面中，就算整個人都藏在椅子后面，依然可以輸出人物模型。

和另一 baseline OccNeRF 相比，W2A 只需 100 幀的訓練視頻就能復原出完整干凈的結構，但后者用了 500 幀的系列視頻后不僅結構缺陷極大，還存在許多“鬼影”。

測試數據也表明，對于陌生場景，W2A 的提取質量和完整性（comp.）都比 V2A 有所提升，特別是對遮擋（llm）部分，合成質量得分接近翻番。

和 OccNeRF 相比，W2A 與 500 幀訓練數據的 OccNeRF 整體成績接近，但遮擋部分仍然是有明顯增強。

那么，Wild2Avatar 是如何實現的呢？

人物與遮擋分層處理

工作過程中，W2A 將整個場景分成了遮擋物、人物本體和背景三部分。

這三個部分由獨立的 NeRF 網絡分別預測特征，渲染圖像時再將三個部分的輸出拼合。

這種做法的主要目的是為了避免遮擋被誤當成人體的一部分，出現 Video2Avatar 那樣把遮擋物合成進人物的情況。

具體來說，李飛飛團隊將圖像映射到一個球空間，背景位于球外，人物和遮擋物則分別位于球空間內部的不同位置。

遮擋空間是通過內部采樣點的坐標和距離來構造的。用于遮擋部分的生成網絡與背景共享，可以預測遮擋空間樣本點的顏色和密度值。

而人體部分的處理則是使用 SMPL 的參數化方式，通過正向和反向皮膚擬合，先將人體變形到一個姿態不變的坐標空間，再輸入神經網絡進行學習。

為了增強任務模型的完整性，李飛飛團隊還設計了新的損失計算方式。

首先利用現成的分割模型輸出人體的二值分割掩碼，并掩碼取反得到“非人體”區域的掩碼，即為可能的遮擋區域。

同時，從 W2A 渲染的三個部分中遮擋部分的密度圖，然后根據提取結果再分離出人體部分。

其中人體部分與前面得到的“非人體”掩碼進行與非運算，得到的結果再和遮擋部分的密度圖做二值交叉熵運算，就得到了遮擋解耦損失 Locc。

Locc 會與像素重構損失、場景分解損失等其他損失參數一并納入到整個網絡的端到端訓練過程，用于優化更新網絡參數。

論文地址：

https://arxiv.org/abs/2401.00431

本文來自微信公眾號：量子位（ID：QbitAI），作者：克雷西

本文鏈接：http://www.tebozhan.com/showinfo-45-3196-0.html李飛飛團隊實現“隔空建模”，透過遮擋物還原完整 3D 人體模型

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：更多作家起訴 OpenAI 和微軟：“竊取”他們的作品訓練 AI 模型

下一篇：谷歌家務機器人單挑斯坦福炒蝦機器人！端茶倒水逗貓，連甩三連彈開打

標簽：

熱門焦點

拯救XR，蘋果力不從心

來源 | 光子星球撰文 | 文燁豪編輯 | 吳先之蘋果終于呈上了它的“答卷”。北京時間6月6日凌晨，蘋果2023年全球開發者大會（WWDC）如期舉行。作為蘋果CEO庫克口中&ld
2022開年最熱投資賽道竟是虛擬人，背后隱藏了什么商業價值？

在剛剛結束不久的2021年江蘇衛視跨年演唱會上，虛擬鄧麗君與歌手周深同臺聯唱，實現了跨時代合作，而這還不只是“鄧麗君”，嗶哩嗶哩、東方衛視等多家跨年晚會都出現
如何對一款 NFT 項目進行價值評估？

原文作者 | Othmane Senhaji Rhazi，Web 3 企業家.編譯整理 | 黑米@白澤研究院我之所以成為一位大力倡導 Web3 和 NFT 領域的企業家，因為我相信我們正在見證社會
避坑指南：遠離具有這些特性的NFT

關于NFT，在我們的文章中一直以來都是常駐嘉賓，不止因為NFT背后隱藏的潛力，更因為在這個NFT世界里冥冥之中仿佛有一雙幕后的手，OpenSea、庫里、ERC115、視覺中國、
“虛擬人”角斗場，基于“硬實力”下的人性平衡法則？

在打工人“反內卷”的當下，一眾虛擬人卻“內卷”了起來。從北京春晚虛擬人蘇小妹與劉宇演繹歌舞《星河入夢》，央美畢業的虛擬人夏語冰登上央視節目《對話》，湖南
2022年中國元宇宙系列報告：底層架構研究：虛擬引擎，擎動未來

“虛擬引擎是元宇宙平臺搭建的基本工具。在這樣的條件下，虛擬引擎擁有了廣闊的市場空間。也需要虛擬引擎擁有擁有強大的處理能力，能夠高效快速的實現大量交互場
「國產良心」NFT嘲諷了誰？

2月23日，一個名為「國產良心」的NFT項目被許多活躍的加密用戶注意到。該項目的官網風格尤為「不正經」，它絲毫沒有避諱自己的小作坊出身，還將「中國人不騙中國人
扎克伯格演示了一種“造物主”式的元宇宙語音機器人工具

前身為Facebook的Meta公司今天展示了一個人工智能系統的Demo，該系統使人們能夠通過語音命令生成或導入虛擬世界中的事物。該公司認為這個被稱為 "Builder Bot "
用戶可以把自己的醫療健康數據做成NFT出售給醫藥公司掙錢

你可能聽說過不可偽造的代幣，或NFTs。NFTs是數字代幣，代表完全獨特的項目的所有權；存儲在區塊鏈中并可追蹤，它們不能被修改、替換或復制。作為NFT鑄造的資產在數字

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

李飛飛團隊實現“隔空建模”，透過遮擋物還原完整 3D 人體模型

拯救XR，蘋果力不從心

2022開年最熱投資賽道竟是虛擬人，背后隱藏了什么商業價值？

如何對一款 NFT 項目進行價值評估？

避坑指南：遠離具有這些特性的NFT

“虛擬人”角斗場，基于“硬實力”下的人性平衡法則？

2022年中國元宇宙系列報告：底層架構研究：虛擬引擎，擎動未來

「國產良心」NFT嘲諷了誰？

扎克伯格演示了一種“造物主”式的元宇宙語音機器人工具

用戶可以把自己的醫療健康數據做成NFT出售給醫藥公司掙錢

最新推薦

25萬虛擬er在“元宇宙”追星

權限風波過后 X2Y2如何挑戰OpenSea？

Terra鏈上TVL躍升至第二

傳統互聯網與區塊鏈場景下數據權利法律分析

元宇宙風歸何處？

我們離元宇宙的實現只差一副眼鏡？

猜你喜歡

熱門推薦

相關資訊