階躍星辰公司近期宣布了一項重大決定,將自家圖像編輯領域的明星大模型Step1X-Edit向公眾開放源代碼。據官方宣稱,這款模型在開源社區中已達到最新技術水平,即SOTA狀態。Step1X-Edit憑借其強大的功能,能夠應對多種高頻圖像編輯需求,包括文字替換、風格遷移、材質變換、人物修圖等11種常見任務類型,幾乎覆蓋了用戶在進行圖像編輯時的所有需求。
這款圖像編輯大模型的總參數量達到了驚人的190億,其中,70億參數屬于MLLM(推測為多模態語言模型),而另外的120億參數則歸屬于DiT(推測為擴散模型)。Step1X-Edit專注于自然語言圖像編輯任務,并具備三大核心優勢。
首先,Step1X-Edit具備出色的語義解析能力。它能夠準確理解并執行用戶通過自然語言描述的復雜指令,無需依賴任何預設模板。這意味著用戶在進行圖像編輯時,可以更加自由地進行多輪、多任務的編輯操作。模型還能對圖像中的文字進行精準識別、替換與重構,顯著提升了圖像編輯的效率和靈活性。
其次,Step1X-Edit在保持身份一致性方面表現出色。在進行圖像編輯的過程中,它能夠穩定地保留圖像中的人臉、姿態和身份特征。這一特點對于虛擬人形象、電商模特展示以及社交圖像編輯等需要高度一致性的場景來說,尤為重要。用戶無需擔心編輯后的圖像出現身份特征不一致的問題。
最后,Step1X-Edit還具備高精度區域級控制能力。它能夠根據用戶的指令,對圖像中的指定區域進行文字、材質、色彩等定向編輯,同時保持圖像整體風格的統一。這種精細化的控制能力使得編輯后的圖像更加自然、逼真,滿足了用戶對高質量圖像編輯的需求。
本文鏈接:http://www.tebozhan.com/showinfo-45-12672-0.html階躍星辰Step1X-Edit大模型開源:19B參數,圖像編輯能力再升級!
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com