苹果AI研究团队在ICLR 2026发表论文,提出新型3D生成方法LiTo。该方法能够从单张图片还原出完整的3D对象,并确保在切换视角时,镜面高光、菲涅耳反射等复杂光影效果能动态、自洽地变化。
技术突破
- 统一编码:将物体几何与视角相关的外观统一编码至同一3D潜在空间。
- 流匹配模型:通过潜在流匹配模型,仅凭单张图片即可生成高质量的3D结果。
- 高质量数据:使用数千个3D对象进行训练,每个对象从150个视角、3种光照条件渲染,使模型能学习完整的几何与外观重建。
效果对比
实验表明,LiTo在视觉质量和对输入图片的还原度上,均优于现有方法TRELLIS。
论文信息
- 作者:Jen-Hao Rick Chang, Xiaoming Zhao(并列一作), Dorian Chan, Oncel Tuzel
- 公开平台:论文已在arXiv公开。