當前位置：首頁 > 元宇宙 > AI

20% 的楊冪 + 80% 的泰勒長什么樣？小紅書風格化 AI 來了，可兼容 SD 和 ControlNet

來源：責編：時間：2024-01-22 17:19:33 301觀看

導讀不得不說，現在拍寫真真是“簡單到放肆”了。真人不用出鏡，不用費心凹姿勢、搞發型，只需一張本人圖像，等待幾秒鐘，就能獲得 7 種完全不同風格：仔細看，造型 / pose 全都給你整得明明白白，并且原圖直出修也不用修了。這

不得不說，現在拍寫真真是“簡單到放肆”了。

真人不用出鏡，不用費心凹姿勢、搞發型，只需一張本人圖像，等待幾秒鐘，就能獲得 7 種完全不同風格：

仔細看，造型 / pose 全都給你整得明明白白，并且原圖直出修也不用修了。

這擱以前，不得在寫真館耗上至少整整一天，把咱和攝影師、化妝師都累個半死不活。

以上，便是一個叫做 InstantIDAI 的厲害之處。

除了現實寫真，它還能整點“非人類的”：

比如貓頭貓身，但仔細看又有你的臉部特征。

各種虛擬風格就更不用說了：

像 style 2，真人直接變石像。

當然，輸入石像也能直接變：

對了，還能進行倆人臉融合的高能操作，看看 20% 的楊冪 + 80% 的泰勒長什么樣：

一張圖無限高質量變身，可是叫它玩明白了。所以，這是怎么做到的？

基于擴散模型，可與 SD 無縫集成

作者介紹，目前的圖像風格化技術已經可以做到只需一次前向推理即可完成任務（即基于 ID embedding）。

但這種技術也有問題：要么需要對眾多模型參數進行廣泛微調，要么與社區開發的預訓練模型缺乏兼容性，要么無法保持高保真度的面部特征。

為了解決這些挑戰，他們開發了 InstantID。

InstantID 基于擴散模型打造，其即插即用（plug-and-play）模塊僅靠單張面部圖像即可熟練地處理各種風格化變身，同時確實高保真度。

最值得一提的是，它可與時下流行的文本到圖像預訓練擴散模型無縫集成（例如 SD1.5、SDXL），作為插件使用。

具體來看，InstantID 由三個關鍵組成部分：

（1）捕獲語義人臉信息的 ID embedding；

（2）具有解耦交叉注意力的輕量級適配模塊，方便圖像作為視覺提示；

（3）IdentityNet 網絡，它通過額外的空間控制對參考圖像的詳細特征進行編碼，最終完成圖像生成。

而相比業內此前的工作，InstantID 有幾點不同：

一是不用訓練 UNet，因此可以保留原始文本到圖像模型的生成能力，并兼容社區中現有的預訓練模型和 ControlNet。

二是不需要 test-time 調整，因此對于特定風格，不需要收集多張圖像進行微調，只需要對單個圖像進行一次推斷即可。

三是除了實現更好的面部保真度，也保留了文本可編輯性。如下圖所示，只需幾個字，即可讓形象變性別、換套裝、改發型以及發色。

再次強調，以上所有效果只需 1 張參考圖像在幾秒內即可完成。如下圖實驗證明，多來幾張參考圖的作用基本不大，1 張就能做得很好。

下面是一些具體對比。

比較對象是現有的免調優 SOTA 方法：IP-Adapter (IPA)、IP-Adapter-FaceID 以及前兩天騰訊剛剛出品的 PhotoMaker。

可以看到，大家都挺“卷”的，效果都不賴 —— 但仔細對比的話，PhotoMaker 和 IP-Adapter-FaceID 保真度都不錯，但文本控制能力明顯差一點。

相比之下，InstantID 的面孔和樣式能更好地融合，在實現了更好保真度的同時，還保留了良好的文本可編輯性。

除此之外，還有與 InsightFace Swapper 模型的比較，你覺得哪個效果更好呢？

作者介紹

本文一共 5 位作者，來自神秘的 InstantX 團隊（網上沒有搜到太多信息）。不過一作是來自小紅書的 Qixun Wang。

通訊作者王浩帆也是小紅書的工程師，從事可控和條件內容生成（AIGC）方面的研究，是 CMU'20 屆校友。

參考鏈接：

https://instantid.github.io/

本文來自微信公眾號：量子位（ID：QbitAI），作者：豐色

本文鏈接：http://www.tebozhan.com/showinfo-45-3254-0.html20% 的楊冪 + 80% 的泰勒長什么樣？小紅書風格化 AI 來了，可兼容 SD 和 ControlNet

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：國際貨幣組織：人工智能可能加劇貧富差距，員工是否熟練掌握 AI 將影響薪酬

下一篇：微軟推出獨立 AI 工具“閱讀教練”，輔助提高學習者閱讀能力

標簽：

熱門焦點

ChatGPT訪問量增速下滑，AI真的是一場泡沫嗎？

來源：首席商業評論2023年，最火的莫過于ChatGPT，席卷全球的同時也引發了生成式AI（人工智能）的投資熱潮。在美股，ChatGPT相關概念股飆漲，以AI算力龍頭英偉達為例，其股價年內一度累計上
中文在線的“元宇宙”故事，資本聽膩了？

被譽為“元宇宙”龍頭之一的中文在線，這下尷尬了。2022年1月11日，中國移動通信聯合會元宇宙產業委員會揭牌，接納涉足“元宇宙”的8家上市公司，包括中青寶、天下秀
2022年6款最佳的NFT稀有度查詢工具

NFT正在風靡全球，但擁有一個你自認為看起來很酷的 NFT 是不夠的，因為它還應該是稀有的，稀有度會影響每個 NFT 的價值。因此，如果您打算投資 NFT，則需要使用 NFT 稀
《刀劍神域》VR展開幕；《Puzzling Places》發布第二個付費DLC

今日熱點：《刀劍神域：Ex-Chronicle Online Edition》VR展開幕；虛擬活動平臺EventX再獲800萬美元B輪融資；VR射擊游戲《Outlier》確認將于3月17日登陸Steam平臺等。
Meta、谷歌、微軟競相涌入元宇宙，小型企業該如何伺機而動？

目前來看元宇宙不會影響到小型企業的發展，但在接下來的十年內可能會發生很多變化。很多有商業頭腦的企業家都在密切關注著元宇宙的發展。元宇宙這個詞，你一定或
DAO登上了歷史舞臺，但是主流準備好采用DAO了嗎？

Block-807DAO要么是定義虛擬未來、無領導組織的革命性概念，要么是充滿存在主義和自我毀滅挑戰的反烏托邦結構，取決于你在與誰交談。近幾個月來， DAO已經從Crypto
NFT世界的藝術家名單

我們匯編了以下藝術家的名單，它包括每個藝術家的簡短概述。當然，這份名單肯定不全面，還有很多很多藝術家、哲學家和商業領袖為世界貢獻了不可估量的價值。而他們
NFT行業的三大區塊鏈之一引起了Snoop Dogg的強烈興趣，究竟有何潛力？

Block-810多個區塊鏈吸引了希望創建單個NFT或整個集合的用戶的注意。Tezos是其中因其低費用和低碳排放方式而備受贊譽的區塊鏈，就連Snoop Dogg也希望通過公開他
電影工業巨頭好萊塢計劃進軍元宇宙，將會對行業帶來什么影響？

元宇宙聽起來像不像是科幻小說中出現的術語？事實確實如此。小說家尼爾·斯蒂芬森在1992年的小說《雪崩》中首次用這個詞來定義了一個多連接的虛擬宇宙，它能夠模

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

20% 的楊冪 + 80% 的泰勒長什么樣？小紅書風格化 AI 來了，可兼容 SD 和 ControlNet

ChatGPT訪問量增速下滑，AI真的是一場泡沫嗎？

中文在線的“元宇宙”故事，資本聽膩了？

2022年6款最佳的NFT稀有度查詢工具

《刀劍神域》VR展開幕；《Puzzling Places》發布第二個付費DLC

Meta、谷歌、微軟競相涌入元宇宙，小型企業該如何伺機而動？

DAO登上了歷史舞臺，但是主流準備好采用DAO了嗎？

NFT世界的藝術家名單

NFT行業的三大區塊鏈之一引起了Snoop Dogg的強烈興趣，究竟有何潛力？

電影工業巨頭好萊塢計劃進軍元宇宙，將會對行業帶來什么影響？

最新推薦

在元宇宙賣酸奶，這波聯動燃爆了！

元宇宙是投資中國的第五次重大機遇

完美世界被元宇宙“拒之門外”

2022 區塊鏈 50 強榜單；垃圾NFT項目的十三個特性

2022年6款最佳的NFT稀有度查詢工具

好萊塢：一股新的電影制作加密浪潮將顛覆這個行業

猜你喜歡

熱門推薦

相關資訊