TRELLIS.2 – 微软开源的40亿参数3D生成模型
TRELLIS.2是什么
TRELLIS.2是微软开源的40亿参数3D生成模型,专为从单张图片高效生成高保真3D资产设计。核心创新在于采用O-Voxel稀疏体素架构,能处理复杂拓扑结构(如开放表面、非流形几何),支持完整PBR材质建模。在NVIDIA H100上生成512³分辨率模型仅需3秒,最高支持1536³超高清渲染。相比传统方法,通过16倍空间下采样显著提升效率,同时提供GLB格式导出功能,适用于游戏、影视和工业设计等领域。

TRELLIS.2的主要功能
- 图像到3D生成:能根据输入的图像快速生成高质量的3D模型,适用于从2D图像创建3D资产的场景。
- 文本到3D生成:支持基于文本描述生成3D模型,用户可以通过文字指令生成所需的3D对象。
- 复杂拓扑处理:可以处理复杂的3D结构,包括开放表面、非流形几何和内部封闭结构,生成具有复杂形状的3D模型。
- 材质与纹理生成:生成的3D模型支持多种材质属性(如基础颜色、粗糙度、金属度、不透明度等),并支持透明度和逼真渲染。
- 多分辨率支持:支持从512³到1536³等多种分辨率的3D模型生成,用户可以根据需求选择合适的分辨率。
- 快速渲染与导出:生成的3D模型可以直接用于渲染,并支持导出为GLB等标准3D文件格式,便于在其他软件中使用。
- 模型编辑与变体生成:用户可以对生成的3D模型进行编辑,生成同一对象的不同变体,满足多样化的设计需求。
TRELLIS.2的技术原理
- O-Voxel表示:采用“O-Voxel”稀疏体素结构,这是一种创新的3D表示方法,能高效处理复杂拓扑和锐利特征,突破传统等值面场的限制,支持开放表面、非流形几何和内部封闭结构。
- 稀疏3D VAE编码:通过稀疏3D变分自编码器(VAE)将3D资产编码到紧凑的潜在空间中,实现高效的压缩和生成,支持16倍的空间下采样,显著提升处理效率。
- 全纹理建模:不仅处理基础颜色,还能模拟粗糙度、金属度和不透明度等PBR材质属性,支持透明度和逼真渲染,生成的3D模型具有丰富的纹理细节。
- 极简数据处理流程:数据处理无需复杂的渲染或优化步骤,可在短时间内完成纹理网格与O-Voxel之间的转换,大大简化了处理流程,提升了生成速度。
- 高效渲染与后处理:结合CUDA加速的网格处理工具(如CuMesh)和高效的渲染技术,快速生成高质量的3D模型,并支持实时渲染和后处理操作。
- 大规模预训练:在大规模数据集上进行预训练,模型学习了丰富的3D形状和纹理特征,能根据输入的图像或文本生成多样化的3D资产。
TRELLIS.2的项目地址
项目官网:https://microsoft.github.io/TRELLIS.2/
Github仓库:https://github.com/microsoft/TRELLIS.2
HuggingFace模型库:https://huggingface.co/microsoft/TRELLIS.2-4B
arXiv技术论文:https://arxiv.org/pdf/2512.14692
在线体验Demo:https://huggingface.co/spaces/microsoft/TRELLIS.2
TRELLIS.2的应用场景
- 游戏开发:快速生成高质量的3D游戏资产,如角色、道具、场景等,提升开发效率,降低制作成本。
- 影视制作:用于创建逼真的3D特效和虚拟场景,支持复杂的材质和纹理,满足影视行业对视觉效果的高要求。
- 虚拟现实(VR)和增强现实(AR):生成沉浸式的3D环境和物体,增强用户体验,适用于VR/AR应用开发。
- 建筑设计与可视化:快速生成建筑模型和室内设计的3D可视化,帮助设计师和客户更好地理解和评估设计方案。
- 工业设计与产品开发:创建产品原型的3D模型,加速设计迭代过程,便于进行虚拟展示和功能测试。
- 教育与培训:作为教学工具,帮助学生和受训者更好地理解和掌握3D建模、渲染和设计的相关知识和技能。
-
VibeVoice-ASR – 微软开源的长音频语音识别模型
VibeVoice-ASR是什么VibeVoice-ASR 是微软开源的先进语音识别模型,专为处理长达60分钟的长音频设计。模型能一次性处理整段音频,保持全局上下文,避免传统模型分段处理导致的上下文丢
-
json-render – Vercel开源的AI生成UI渲染可控方案
json-render是什么json-render是 Vercel 开源的项目,解决 AI 生成 UI 的不可控问题。json-render通过定义一个 Catalog,约束 AI 只能生成符合特定
-
EmbodiChain – 跨维智能开源的具身智能学习平台
EmbodiChain是什么EmbodiChain 是跨维智能开源的具身智能学习平台,通过生成式仿真数据推动具身智能的发展。自动创建符合物理规律的 3D 场景和任务,结合在线数据流和自我修复机制,高效
[广告]赞助链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注KnowSafe微信公众号随时掌握互联网精彩
- 俄罗斯漏洞经纪商开价400万美元收购即时通讯工具Telegram的0day漏洞
- Home Assistant来自全球DIY爱好者的开源家庭自动化项目
- Spug轻量强大的开源运维平台,超赞!
- 腾讯推出智能工作台ima.copilot
- 微软买断制Office 2024正式上线!5年支持约1000元起
- Gocron开源免费的定时任务管理系统
- 华为公布“十大发明”评选成果,分享知识产权和创新进展
- 诸子笔会 | 12月盘点,打卡积分及月奖公布
- 在Z|德国电信咨询中国区(高至35K/月14薪)诚招安全策略及治理高级咨询顾问
- 在Z|贝壳找房(80万/年)、上海百胜(56万/年)招贤;9年IT、6年信安经验求职信安总监
- 利用shodan搜索公网摄像头
- 不建议企业使用自签名SSL证书的原因有哪些?



