苹果公司近日发布了名为 LiTo 的最新 AI 模型,能够仅凭一张 2D 图像重建出具有物理级别真实感的 3D 对象。这项类似TRELLIS.2-4B的 3D 重建技术突破,解决了单图生成 3D 模型时的光影一致性问题,被视为苹果在空间计算领域的重要布局,可能成为 Vision Pro 的关键技术支撑。
一、LiTo 模型的技术突破
潜在空间表示法:LiTo 模型通过创新的潜在空间表示法,解决了单图生成 3D 模型时光影一致性的核心难题。传统方法在处理复杂光照条件时容易出现不一致的渲染效果,而 LiTo 能够在统一的潜在空间中表示物体的几何结构和光照属性。
光影预测能力:该模型具备强大的"脑补"能力,能精准预测物体背面在不同光照条件下的镜面高光和菲涅尔反射。这意味着即使输入图像只展示物体的一个角度,LiTo 也能生成完整、真实的 3D 模型。
物理级别真实感:LiTo 生成的 3D 模型不仅在几何形状上准确,更在材质、光照、反射等物理属性上达到真实级别。这种高保真度使得生成的模型可以直接用于专业场景。

二、技术原理与实现方式
单图输入架构:LiTo 采用单图输入架构,用户只需提供一张 2D 图像即可完成 3D 重建。这种设计大幅降低了使用门槛,使得普通用户也能轻松创建高质量的 3D 内容。
联合优化策略:模型采用联合优化策略,同时优化几何结构、材质属性和光照条件。这种端到端的训练方式确保了各个组件之间的协调一致,避免了分步优化带来的误差累积。
神经渲染技术:LiTo 集成了先进的神经渲染技术,能够实时生成高质量的渲染结果。这种技术使得模型不仅可以输出静态 3D 模型,还能支持动态视角切换和交互式浏览。

三、应用场景与生态价值
Vision Pro 内容生态:LiTo 模型为苹果 Vision Pro 头显的内容生态提供了强大支持。开发者可以快速将现有的 2D 内容转换为 3D 格式,丰富空间计算应用的内容库,降低 3D 内容创作门槛。
电商与展示:电商平台可以利用 LiTo 技术将商品图片自动转换为 3D 模型,提供 360 度查看体验。房地产、家居设计等行业也能受益于快速 3D 建模能力。
游戏与娱乐:游戏开发者可以快速创建游戏资产,将概念图直接转换为可用的 3D 模型。影视制作、动画行业也能利用这项技术加速内容生产流程。



