當前位置：首頁 > 科技 > 網絡

首個圖像生成基礎模型阿里通義千問深夜開源Qwen-Image 支持中英雙語

來源：責編：時間：2025-08-05 09:21:25 14觀看

導讀快科技8月5日消息，今天凌晨，阿里通義千問宣布開源Qwen-Image，一個20B的MMDiT模型。這是通義千問系列中首個圖像生成基礎模型，其在復雜文本渲染和精確圖像編輯方面取得顯著進展。據了解，該模型專注于提升AI在兩大

快科技8月5日消息，今天凌晨，阿里通義千問宣布開源Qwen-Image，一個20B的MMDiT模型。

這是通義千問系列中首個圖像生成基礎模型，其在復雜文本渲染和精確圖像編輯方面取得顯著進展。

據了解，該模型專注于提升AI在兩大核心場景的能力：復雜的文本渲染與精準的圖像編輯。

功能亮點：

強大的文字渲染能力（本次開源）

效果領先：在多個文本測評榜單中，文字渲染均獲得SOTA。

原生渲染：文字是圖像生成時直出的，而非后期添加，效果更真實。

功能全面：支持中英雙語，多變字體，超長段落，超小文字，并可實現復雜的多位置圖文布局。

基礎扎實：除了文字，模型在人物情緒、細節刻畫和多樣的風格渲染上也同樣表現出色。

精準的圖像編輯能力（即將發布）

效果穩定：多個圖像編輯測評榜單SOTA。

鏈式編輯：在多輪連續修改后，仍能保持主體ID的一致性。

文字編輯：可以編輯圖像中的文字。

復雜編輯：可編輯人物姿勢，提取圖像紋理等。

首個圖像生成基礎模型通義千問深夜開源Qwen-Image 支持中英雙語

通義千問在多個公開基準上對Qwen-Image進行全面評估，包括用于通用圖像生成的GenEval、DPG和OneIG-Bench，以及用于圖像編輯的GEdit、ImgEdit和GSO。

Qwen-Image在所有基準測試中均取得了先進的性能，展現出其在圖像生成與圖像編輯方面的強大能力。

首個圖像生成基礎模型通義千問深夜開源Qwen-Image 支持中英雙語

此外，在用于文本渲染的LongText-Bench、ChineseWord和TextCraft上的結果表明，Qwen-Image在文本渲染方面表現尤為出色，特別是在中文文本渲染上，大幅領先現有的先進模型。

首個圖像生成基礎模型通義千問深夜開源Qwen-Image 支持中英雙語

除了文本處理，Qwen-Image在通用圖像生成方面也表現出色，支持多種藝術風格。

在圖像編輯方面，Qwen-Image支持風格遷移、增刪改、細節增強、文字編輯，人物姿態調整等多種操作，讓普通用戶也能輕松實現專業級圖像編輯。

首個圖像生成基礎模型通義千問深夜開源Qwen-Image 支持中英雙語

本文鏈接：http://www.tebozhan.com/showinfo-17-175593-0.html首個圖像生成基礎模型阿里通義千問深夜開源Qwen-Image 支持中英雙語

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：官方提醒警惕AI“數據投毒” 0.01%虛假訓練文本可致有害內容增加11.2%

下一篇： 10歲小女孩快遞站玩耍手臂被卷入傳送帶整個身體懸空

標簽：

熱門焦點

《英雄聯盟》夏季賽總決賽今日開打！JDG對陣LNG首發名單來了 Knight：準備三連冠

8月5日消息，今日17:00，《英雄聯盟》2023LPL夏季賽總決賽將正式開打，由JDG對陣LNG。對兩支隊伍來說，這場比賽不僅要爭奪夏季賽冠軍，更要決定誰才是LPL賽區一
Flowable工作流引擎的科普與實踐

一.引言當我們在日常工作和業務中需要進行各種審批流程時，可能會面臨一系列技術和業務上的挑戰。手動處理這些審批流程可能會導致開發成本的增加以及業務復雜度的上升。在這
虛擬鍵盤 API 的妙用

你是否在遇到過這樣的問題：移動設備上有一個固定元素，當激活虛擬鍵盤時，該元素被隱藏在了鍵盤下方？多年來，這一直是 Web 上的默認行為，在本文中，我們將探討這個問題、為什么會發生
使用AIGC工具提升安全工作效率

在日常工作中，安全人員可能會涉及各種各樣的安全任務，包括但不限于：開發某些安全工具的插件，滿足自己特定的安全需求；自定義github搜索工具，快速查找所需的安全資料、漏洞poc、exp
年輕人的“職場羞恥感”，無處不在

作者：馮曉亭陶淘李欣張琳馬舒葉來源：燃次元“人在職場，應該選擇什么樣的著裝？”近日，在網絡上，一個與著裝相關的帖子引發關注，在該帖子里，一位在高級寫字樓亞洲金
小米MIX Fold 3配置細節曝光：搭載領先版驍龍8 Gen2+罕見5倍長焦

這段時間以來，包括三星、一加、榮耀等等有不少品牌旗下的最新折疊屏旗艦都得到了不少爆料，而小米新一代折疊屏旗艦——小米MIX Fold 3此前也屢屢被傳
華為發布HarmonyOS 4：更好玩、更流暢、更安全

在8月4日的華為開發者大會2023（HDC.Together）大會上，HarmonyOS 4正式發布。自2019年發布以來，HarmonyOS一直以用戶為中心，經歷四年多的發展HarmonyOS已
世界人工智能大會國際日開幕式活動在世博展覽館開啟

30日上午，世界人工智能大會國際日開幕式活動在世博展覽館開啟，聚集國際城市代表、重量級院士專家、國際創新企業代表，共同打造人工智能交流平臺。上海市副市
親歷馬斯克血洗Twitter，硅谷的苦日子在后頭

文/劉哲銘　　編輯/李薇　　馬斯克再次揮下裁員大刀。　　美國時間11月14日，Twitter約4400名外包員工遭解雇，此次被解雇的員工的主要工作為內容審核等。此前，T

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首個圖像生成基礎模型阿里通義千問深夜開源Qwen-Image 支持中英雙語

《英雄聯盟》夏季賽總決賽今日開打！JDG對陣LNG首發名單來了 Knight：準備三連冠

Flowable工作流引擎的科普與實踐

虛擬鍵盤 API 的妙用

使用AIGC工具提升安全工作效率

年輕人的“職場羞恥感”，無處不在

小米MIX Fold 3配置細節曝光：搭載領先版驍龍8 Gen2+罕見5倍長焦

華為發布HarmonyOS 4：更好玩、更流暢、更安全

世界人工智能大會國際日開幕式活動在世博展覽館開啟

親歷馬斯克血洗Twitter，硅谷的苦日子在后頭

最新推薦

猜你喜歡

熱門推薦

相關資訊

首個圖像生成基礎模型 阿里通義千問深夜開源Qwen-Image 支持中英雙語

最新推薦

猜你喜歡

熱門推薦

相關資訊

首個圖像生成基礎模型阿里通義千問深夜開源Qwen-Image 支持中英雙語