Skip to content
Pixal3D

Pixal3D

从单张图片像素级精准生成带PBR纹理的高保真3D模型

应用特点

开源3D

系统要求

建议32GB以上内存。硬盘空间42GB以上。
Windows10/11 64位,NVIDIA显卡,16GB以上显存。
注意:NVIDIA显卡,请安装较新版本的驱动。

应用介绍

注意:

  1. 代码与模型:核心代码遵循 MIT 协议,但内置的部分第三方模型权重禁止商用(CC BY-NC 4.0)。
  2. 收费性质:您支付的费用仅为本地安装服务费,不包含任何模型的商业授权。
  3. 商用限制:本工具仅供学习研究。如需商用,请自行向原作者(如 Meta 等)申请许可。

一、项目基础信息

Pixal3D是腾讯ARC实验室联合清华大学、惠灵顿维多利亚大学共同研发的开源项目,成果已被国际顶级会议SIGGRAPH 2026收录,主打单张图像生成像素对齐高保真3D模型能力。

二、核心功能与产品特点

  1. 一键单图转3D:仅需上传一张普通2D图片,就能自动生成可通用的GLB格式3D网格模型,自带精细几何结构与标准PBR物理材质纹理。
  2. 像素级精准对齐:区别于传统依靠注意力机制模糊融合图像特征的方式,通过反向投影技术建立2D像素与3D空间的一一对应关系,最大程度还原原图细节,生成效果接近专业三维重建水准。
  3. 低显存适配:内置低显存运行模式,可按需加载模型降低显存占用,普通消费级显卡也能流畅运行,还支持自定义生成分辨率。
  4. 灵活使用方式:提供命令行推理、Gradio网页可视化演示两种使用模式,同时开放完整训练代码与数据预处理工具,支持开发者二次训练与定制开发。
  5. 双版本可选:分为main版(基于Trellis.2骨干网络,性能更强)和paper版(基于Direct3D-S2,复现论文实验结果)。

三、适用应用场景

广泛适用于游戏3D素材制作、影视动画建模、元宇宙数字资产创作、AR/VR虚拟物体生成、电商3D商品展示、文创数字建模等领域,大幅降低3D资产制作门槛。

四、底层核心技术

底层依托Trellis.2、Direct3D-S2作为基础骨干网络;采用三阶段级联生成架构(稀疏结构→形状细化→纹理生成),搭配3D潜变量扩散模型、像素反向投影特征提升、稀疏VAE与密集VAE解码技术,实现多分辨率渐进式高精度3D生成。