多模态再上新!阶跃星辰开源3D大模型Step1X-3D

2025-05-14ASPCMS社区 - fjmyhfvclm

自上周发布音跃模型 ACE-Step之后,阶跃星辰5月14日又有新动作:当天,公司正式发布并开源3D大模型——Step1X-3D,这是继图像、视频、语音、音乐等模态后,公司在多模态方向的最新成果,意味着阶跃星辰在多模态方向上再迈坚实一步。

上证报中国证券网讯(记者 宋薇萍 谭镕)自上周发布音跃模型ACE-Step之后,阶跃星辰5月14日又有新动作:当天,公司正式发布并开源3D大模型——Step1X-3D,这是继图像、视频、语音、音乐等模态后,公司在多模态方向的最新成果,意味着阶跃星辰在多模态方向上再迈坚实一步。

据介绍,Step1X-3D模型总参数量达4.8B(几何模块1.3B,纹理模块3.5B),凭借坚实的数据基础与先进的3D 原生架构,可生成高保真、可控的3D内容。Step1X-3D不止于视觉“好看”,更追求实现“好用”与“可控”,旨在为3D内容创作提供强大而可靠的技术引擎。

当天,阶跃星辰公布了完整的数据清洗策略,数据预处理策略,以及800K高质量的3D资产,3D VAE、3D geometry Diffusion以及 texture Diffusion的全链路训练代码开源,助力3D生成社区发展。

据介绍,Step1X-3D尝试解决3D内容生成的关键挑战,在数据、生成质量与可控性上进行了创新实践。例如,Step1X-3D对超500万原始数据进行严格筛选与处理后,建立了包含200万高质量、标准化的训练样本库,有效克服了行业数据稀缺与质量参差的瓶颈。

此外,Step1X-3D通过增强型网格-SDF转换技术等方法,从源头保障了模型学习的精准性与最终生成的高效性,让水密几何转换成功率提升了20%,也让 Step1X-3D拥有了强大的泛化能力与细节捕捉力。

Step1X-3D采用先进的3D原生两阶段架构,解耦几何与纹理表征,确保生成的不仅是视觉“皮囊”,更是结构可靠、可供下游应用的“骨架”,有效规避几何失真,保证生成的准确性、真实感与一致性。

Step1X-3D则显著提升了3D内容生成的可控性与易用性。其关键在于,VAE-Diffusion整体架构在设计上与主流2D生成模型(如Stable Diffusion)保持了高度一致性,从而能够无缝引入并应用成熟的2D控制技术(如轻量化的 LoRA 微调)。

全部评论