
阶跃星辰开源3D大模型 Step1X-3D,可生成高保真、可控的 3D 内容

阶跃星辰公布了完整的数据清洗策略,数据预处理策略,以及800K高质量的3D资产,3DVAE、3DgeometryDiffusion以及textureDiffusion的全链路训练代码开源,助力3D生成社区发展。开源链接与体验地址:GitHub:https://github.com/stepfun-ai/Step1X-3DHuggingFace:https://huggingface.co/stepfun-ai/Step1X-3DModelScope:https://www.modelscope.cn/models/stepfun-ai/Step1X-3DTechReport:https://arxiv.org/pdf/2505.07747附官方给出的核心特性与技术支撑如下:Step1X-3D尝试解决3D内容生成的关键挑战,在数据、生成质量与可控性上进行了创新实践。
1、数据驱动与算法协同优化
好数据是好模型的基础。Step1X-3D对超500万原始数据进行严格筛选与处理后,建立了包含200万高质量、标准化的训练样本库,有效克服了行业数据稀缺与质量参差的瓶颈。数据处理流程示意图
此外,Step1X-3D通过增强型网格-SDF转换技术等方法,从源头保障了模型学习的精准性与最终生成的高效性,让水密几何转换成功率提升了20%,也让Step1X-3D拥有了强大的泛化能力与细节捕捉力。Step1X-3D数据筛选与SDF转换流程示意图2、3D原生生成:结构清晰、细节生动
Step1X-3D采用先进的3D原生两阶段架构,解耦几何与纹理表征,确保生成的不仅是视觉“皮囊”,更是结构可靠、可供下游应用的“骨架”,有效规避几何失真,保证生成的准确性、真实感与一致性。Step1X-3D的原生3D架构
几何生成模型基于FLUXMMDiT结构和Rectifiedflow算法直接对3D表示生成进行建模
纹理生成模型基于预训练的Diffusionmodel,通过单视图和3D几何信息指导,生成多视角一致的纹理信息
- 几何塑形更精准
几何示例:覆盖硬边与曲面结构
- 纹理细节更生动
纹理示例:呈现清晰一致的表面纹理3、控制简单、效果可调
Step1X-3D显著提升了3D内容生成的可控性与易用性。其关键在于,VAE-Diffusion整体架构在设计上与主流2D生成模型(如StableDiffusion)保持了高度一致性,从而能够无缝引入并应用成熟的2D控制技术(如轻量化的LoRA微调)。因此用户可以对生成3D资产的对称性、表面细节(如锋利度、平滑度)等多种属性进行直观、精细的调控,让创作更精准地符合用户意图。对比图1:对称性控制效果
对比图2:表面细节控制效果(锋利/平滑)
- 性能评估
在与主流3D模型的对比评测中,特别是在衡量内容与输入语义一致性的核心指标CLIP-Score上,Step1X-3D取得了当前所有对比模型中的最高分,为开源社区提供了极具竞争力的3D生成方案。
不同3D模型测评对比数据
OnlineDemo:https://huggingface.co/spaces/stepfun-ai/Step1X-3D