當前位置：首頁 > 元宇宙 > AI

一張圖 + 一句話實現任意角色場景姿勢，騰訊混元宣布開源定制化圖像生成插件 InstantCharacter

來源：責編：時間：2025-04-21 09:45:17 12觀看

導讀 4 月 18 日消息，騰訊混元今日宣布開源定制化圖像生成插件InstantCharacter，并實現了對開源文生圖模型 Flux 的兼容。騰訊官方介紹稱，通過這個插件，在大模型中，只需要一張圖加一句話，就可以讓任何角色以你想要的姿勢

4 月 18 日消息，騰訊混元今日宣布開源定制化圖像生成插件InstantCharacter，并實現了對開源文生圖模型 Flux 的兼容。

騰訊官方介紹稱，通過這個插件，在大模型中，只需要一張圖加一句話，就可以讓任何角色以你想要的姿勢出現在任何地方。

輸入原始圖片

+ prompt ：a rabbit is in the kitchen holding a spoon and drinking soup

就能得到下面的圖：

+prompt：a rabbit in the city,cyberpunk

就可以得到：

角色一致性是多輪文生圖場景中的一大難題。InstantCharacter 的優勢在于可以確保角色在不同場景中的一致性和真實性、畫質和精度高，同時具有靈活的文本編輯性，用戶可以根據需要靈活切換任意場景，讓人物生成任意動作。

其在角色一致性和圖像生成的精確度上號稱超過了此前業界的相關技術，能夠處理多種風格和復雜度的圖像。

通過這個插件，內容創作者可以讓生成的角色保持高度一致，能夠更高效地創作出符合其需求的視覺作品，可以用于連環畫、影片創作等場景。

實際的測評中，開源的 InstantCharacter 實現的效果媲美 GPT 4o 等模型。

從技術上看，現有基于學習的方法主要依賴于 U-Net 架構，但在泛化能力和圖像質量上存在局限性，而基于優化的方法則需要針對特定主體進行微調，這不可避免地降低了文本可控性。

為了解決這些挑戰，InstantCharacter 利用 DiT 模型構建了一個創新的框架。框架引入了一個可擴展的適配器（adapter），采用多個 transformer encoder，能夠有效處理開放域的角色特征，并與現代擴散變換器的潛在空間無縫交互。這種設計使得系統能夠靈活適應不同的角色特征。

同時，為了有效訓練框架，騰訊混元團隊還構建了一個包含千萬級樣本的大規模角色數據集。數據集被系統地組織為成對（多視角角色）和非成對（文本-圖像組合）子集。這種雙數據結構使得身份一致性和文本可編輯性能夠通過不同的學習路徑同時優化。

附項目相關鏈接：

項目官網：https://instantcharacter.github.io/

代碼：https://github.com/Tencent/InstantCharacter

Hugging Face Demo：https://huggingface.co/spaces/InstantX/InstantCharacter

論文：https://arxiv.org/abs/2504.12395

本文鏈接：http://www.tebozhan.com/showinfo-45-12417-0.html一張圖 + 一句話實現任意角色場景姿勢，騰訊混元宣布開源定制化圖像生成插件 InstantCharacter

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： OpenAI 新推理模型被曝產生更多“幻覺”，o3 o4-mini 性能與錯誤率一同提升

下一篇：研究稱生成式 AI 背后隱藏高昂水電消耗，直接影響數據中心周邊生活成本

標簽：

熱門焦點

ChatGPT訪問量增速下滑，AI真的是一場泡沫嗎？

來源：首席商業評論2023年，最火的莫過于ChatGPT，席卷全球的同時也引發了生成式AI（人工智能）的投資熱潮。在美股，ChatGPT相關概念股飆漲，以AI算力龍頭英偉達為例，其股價年內一度累計上
人間誠實周鴻祎：360 All in 大模型的六個解讀

主筆 / 村口有牛文章架構師 / 毛自聰出品 / 巨頭財經5月至今，人間躁動，各路大模型你方唱罷我登場，VC圈互聯網圈媒體圈已近癲狂。誰也沒想到，今日，360再度刷屏，老牌互聯網巨頭展現
茅臺的元宇宙App火了，也被罵慘了

元宇宙從概念走向大眾生活，并不是一件簡單的事情。技術、世界觀、填充內容、載體形式，每一個環節都需要層層疊疊的邏輯。但正如賽博朋克奠基人威廉·吉布
刷完一場元宇宙世界杯音樂盛典，我爽了

作者|劉小土編輯|李春暉你有多久沒完整追過一場音樂盛典了？三刷都不嫌多的那種。按照慣例，每逢年底，直播、長短視頻、音樂平臺便會搶著端上來幾場音樂盛典。擱以
關于年度熱詞NFT，除了錢，我們還可以聊點啥？

每到年底，社交媒體總少不了年度盤點、年度總結、年度熱詞。如果讓你來總結2021年度熱詞，你會想到什么？柯林斯詞典將年度熱詞頒給了“NFT”，而其理由是：一個縮寫詞的
如何對一款 NFT 項目進行價值評估？

原文作者 | Othmane Senhaji Rhazi，Web 3 企業家.編譯整理 | 黑米@白澤研究院我之所以成為一位大力倡導 Web3 和 NFT 領域的企業家，因為我相信我們正在見證社會
NFT Insider #47：YGG發布2021Q4社區報告，GameFi領域1月份獲超10億美元融資

引言：NFT Insider由WHALE社區、BeepCrypto聯合出品，濃縮每周NFT新聞，為大家帶來關于NFT最全面、最新鮮、最有價值的訊息。每期周報將從NFT市場數據，藝術新聞類，游戲
為什么元宇宙將永遠改變體育和你的生活？

自從Facebook更名為Meta以來，Metaverse這個詞已經被大家所熟知。但是當Metaverse仍然被許多人視為一個虛擬的平行世界時，一些項目已經顯示出Metaverse將如何永遠
元宇宙專題二：GameFi 深度解析，元宇宙內容雛形顯現

GameFi=Game（游戲）+DEFI（去中心化金融），核心特點為“Play to Earn”。通過技術與去中心化價值觀賦能，GameFi 游戲資產化身為NFT 和代幣上鏈，具備了可驗證性和流通性；開

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

一張圖 + 一句話實現任意角色場景姿勢，騰訊混元宣布開源定制化圖像生成插件 InstantCharacter

ChatGPT訪問量增速下滑，AI真的是一場泡沫嗎？

人間誠實周鴻祎：360 All in 大模型的六個解讀

茅臺的元宇宙App火了，也被罵慘了

刷完一場元宇宙世界杯音樂盛典，我爽了

關于年度熱詞NFT，除了錢，我們還可以聊點啥？

如何對一款 NFT 項目進行價值評估？

NFT Insider #47：YGG發布2021Q4社區報告，GameFi領域1月份獲超10億美元融資

為什么元宇宙將永遠改變體育和你的生活？

元宇宙專題二：GameFi 深度解析，元宇宙內容雛形顯現

最新推薦

【東方證券】虛擬世界照進現實，元宇宙中有什么？ | 元宇宙Meta洞見

網易音樂、理想申請元宇宙商標被駁回，“啫喱”暫停新用戶進入

多地釋放積極信號，元宇宙正成為地方爭先競逐的主戰場？

吸金31億美元，誰在催火2021年的鏈游？

過去女性在互聯網領域是半邊天，在Web3，將會是整片天！

超級賬本Julian Gordon：聯盟鏈與公鏈的競爭不是非此即彼

猜你喜歡

熱門推薦

相關資訊