微软开源TRELLIS.2评测:3秒生成高分辨率3D纹理资产

2026-06-11阅读 0热度 0
3D生成模型

过去几年,生成式AI在图像、视频、文本等2D领域已实现规模化应用,而3D生成虽近在咫尺,但实际突破困难重重。维度从二维升至三维,本质是对表征方法、训练目标与工程实用性的系统性挑战。

3D生成模型的核心挑战远非“能否生成视觉上合理的对象”,而是在高维空间中同步维护几何一致性、语义稳定性和结构可用性。部分模型在单一视角下表现尚可,但视角偏移后几何立即崩塌;或者视觉逼真度足够,但导出后缺乏可编辑、可复用的标准3D资产格式。这些问题直接阻碍了3D生成技术进入真实生产管线。

近些年业界在多个技术路线上反复试错与迭代。例如,基于NeRF的方法在视觉连续性上表现亮眼,但其天然偏向渲染而非建模,下游所需的mesh、拓扑结构、物理属性难以兼容;基于体素或显式网格的生成方式结构清晰,但分辨率、细节表达与泛化能力长期受限;单视角或少视角3D生成方法在效率上取得突破,但多视角一致性不足和几何结构不稳定仍是普遍痛点。

这些技术路线的反复演变暴露的并非单一模型或训练技巧的缺陷,而是深层系统性问题:3D生成的根本困难在于表征方式、生成路径与训练目标三者之间的系统性失配。若模型优化仅聚焦于“视觉合理性”而忽视“结构正确性”,生成结果便难以从展示阶段跨越到实际应用阶段。

针对这些困境,微软亚洲研究院发布了TRELLIS.2,可生成包含金属、塑料、玻璃、木材、水纹等多种材质的3D物体,同时完整构建内部几何结构。与传统的基于场表达的3D生成方法不同,TRELLIS.2提出了一种非场的新型表征——稀疏体素结构O-Voxel。该表征能够生成任意拓扑、带有丰富材质属性的高分辨率3D资产,并显著降低开发者在预处理阶段的工作量。

更值得关注的是,TRELLIS.2实现了16倍的空间压缩。这意味着即使是40亿参数的大规模生成模型,也能高效进行训练与推理。实际性能方面,生成512³分辨率的全纹理资产仅需约3秒。

目前,「TRELLIS.2 3D生成Demo」已上线OpenBayes官网教程板块。若想亲自上手,可点击下方链接直达一键部署教程。

在线体验:
https://go.openbayes.com/qdiUg

效果演示:


Demo运行步骤

步骤一

运行环境与容器配置

1. 登录OpenBayes.com,进入「公共教程」页面,选取「TRELLIS.2 3D生成Demo」教程。


2. 页面跳转后,点击右上角「克隆」,将教程克隆至个人容器内。


3. 选择「NVIDIA RTX 5090」和「PyTorch」镜像,根据需求选择「按量付费」或「包日/周/月」,点击「继续执行」。

4. 等待资源分配,状态变为「运行中」后,点击「打开工作空间」进入Jupyter Workspace。


步骤二

效果演示操作

页面跳转后,点击左侧「README」页面,进入后点击顶部「运行」按钮。

运行完成后,点击右侧API地址即可跳转至Demo页面。

教程直达链接:
https://go.openbayes.com/qdiUg

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策