5 月 14 日消息,階躍星辰正式發(fā)布并開源 3D 大模型 ——Step1X-3D,這是繼圖像、視頻、語(yǔ)音、音樂(lè)等模態(tài)后,階躍星辰在多模態(tài)方向的最新成果。Step1X-3D 模型總參數(shù)量達(dá) 4.8B(幾何模塊 1.3B,紋理模塊 3.5B),憑借堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)與先進(jìn)的 3D 原生架構(gòu),可生成高保真、可控的 3D 內(nèi)容。階躍星辰稱,Step1X-3D 不止于視覺“好看”,更追求實(shí)現(xiàn)“好用”與“可控”,旨在為 3D 內(nèi)容創(chuàng)作提供強(qiáng)大而可靠的技術(shù)引擎。
階躍星辰公布了完整的數(shù)據(jù)清洗策略,數(shù)據(jù)預(yù)處理策略,以及800K高質(zhì)量的3D資產(chǎn),3D VAE、3Dgeometry Diffusion以及texture Diffusion的全鏈路訓(xùn)練代碼開源,助力3D生成社區(qū)發(fā)展。
開源鏈接與體驗(yàn)地址:
GitHub:https://github.com/stepfun-ai/Step1X-3D
HuggingFace:https://huggingface.co/stepfun-ai/Step1X-3D
ModelScope:https://www.modelscope.cn/models/stepfun-ai/Step1X-3D
Tech Report:https://arxiv.org/pdf/2505.07747
附官方給出的核心特性與技術(shù)支撐如下:
Step1X-3D 嘗試解決 3D 內(nèi)容生成的關(guān)鍵挑戰(zhàn),在數(shù)據(jù)、生成質(zhì)量與可控性上進(jìn)行了創(chuàng)新實(shí)踐。
1、數(shù)據(jù)驅(qū)動(dòng)與算法協(xié)同優(yōu)化好數(shù)據(jù)是好模型的基礎(chǔ)。Step1X-3D 對(duì)超 500 萬(wàn)原始數(shù)據(jù)進(jìn)行嚴(yán)格篩選與處理后,建立了包含 200 萬(wàn)高質(zhì)量、標(biāo)準(zhǔn)化的訓(xùn)練樣本庫(kù),有效克服了行業(yè)數(shù)據(jù)稀缺與質(zhì)量參差的瓶頸。
此外,Step1X-3D 通過(guò)增強(qiáng)型網(wǎng)格-SDF 轉(zhuǎn)換技術(shù)等方法,從源頭保障了模型學(xué)習(xí)的精準(zhǔn)性與最終生成的高效性,讓水密幾何轉(zhuǎn)換成功率提升了 20%,也讓 Step1X-3D 擁有了強(qiáng)大的泛化能力與細(xì)節(jié)捕捉力。
Step1X-3D 采用先進(jìn)的 3D 原生兩階段架構(gòu),解耦幾何與紋理表征,確保生成的不僅是視覺“皮囊”,更是結(jié)構(gòu)可靠、可供下游應(yīng)用的“骨架”,有效規(guī)避幾何失真,保證生成的準(zhǔn)確性、真實(shí)感與一致性。
幾何塑形更精準(zhǔn)
幾何生成的核心在于采用為 3D 特性深度優(yōu)化的創(chuàng)新混合 VAE-DiT 架構(gòu)。該架構(gòu)負(fù)責(zé)生成 TSDF 內(nèi)部表示,確保產(chǎn)出的 3D 模型結(jié)構(gòu)完整、無(wú)破面漏點(diǎn);同時(shí)通過(guò)引入銳利邊緣采樣(Sharp Edge Sampling)等技術(shù),精準(zhǔn)捕捉并還原物體的豐富幾何細(xì)節(jié)。
紋理細(xì)節(jié)更生動(dòng)
紋理生成則基于強(qiáng)大的 SD-XL 模型進(jìn)行深度定制與優(yōu)化。通過(guò)幾何條件(利用法線與位置信息)的精準(zhǔn)引導(dǎo),以及潛在空間多視圖同步技術(shù),實(shí)現(xiàn)了與幾何模塊的高效協(xié)同。確保生成的紋理不僅色彩飽滿、質(zhì)感生動(dòng)逼真,更能跨越多視圖保持高度一致,與復(fù)雜三維表面精密貼合,有效避免常見的扭曲與接縫瑕疵。
Step1X-3D 顯著提升了 3D 內(nèi)容生成的可控性與易用性。其關(guān)鍵在于,VAE-Diffusion 整體架構(gòu)在設(shè)計(jì)上與主流 2D 生成模型(如 Stable Diffusion)保持了高度一致性,從而能夠無(wú)縫引入并應(yīng)用成熟的 2D 控制技術(shù)(如輕量化的 LoRA 微調(diào))。
因此用戶可以對(duì)生成 3D 資產(chǎn)的對(duì)稱性、表面細(xì)節(jié)(如鋒利度、平滑度)等多種屬性進(jìn)行直觀、精細(xì)的調(diào)控,讓創(chuàng)作更精準(zhǔn)地符合用戶意圖。
性能評(píng)估
為了客觀評(píng)估 Step1X-3D 的實(shí)際效果,我們通過(guò)一個(gè)自建的綜合測(cè)試(包含 110 個(gè)多樣化測(cè)試用例),對(duì) Step1X-3D 進(jìn)行了嚴(yán)格的定量與定性評(píng)估,同時(shí)與多款主流模型進(jìn)行全面對(duì)比。
結(jié)果顯示:在自動(dòng)評(píng)估中,Step1X-3D 在多項(xiàng)關(guān)鍵維度上均表現(xiàn)出色。
在與主流 3D 模型的對(duì)比評(píng)測(cè)中,特別是在衡量?jī)?nèi)容與輸入語(yǔ)義一致性的核心指標(biāo) CLIP-Score 上,Step1X-3D 取得了當(dāng)前所有對(duì)比模型中的最高分,為開源社區(qū)提供了極具競(jìng)爭(zhēng)力的 3D 生成方案。
Online Demo:https://huggingface.co/spaces/stepfun-ai/Step1X-3D
本文鏈接:http://www.tebozhan.com/showinfo-45-12918-0.html階躍星辰開源 3D 大模型 Step1X-3D,可生成高保真、可控的 3D 內(nèi)容
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: OpenAI CEO 奧爾特曼暢想未來(lái):構(gòu)建類似操作系統(tǒng)的 AI 產(chǎn)品