近日,由知名人工智能专家李飞飞创立的World Labs正式推出其首个商业产品——Marble 3D世界模型公测版。该工具支持从文本、图像、视频等多种模态输入生成可导航的3D虚拟世界,用户不仅能实时交互编辑,还可轻松导出多种格式,标志着AI生成内容向更沉浸式体验的迈进。
一、多模态输入:一键构建沉浸式3D世界
Marble的核心突破在于其多模态生成能力。用户只需输入简单的文本描述、上传单张或多张图片、视频或粗糙的3D布局,即可生成大规模、风格多样的3D环境。生成过程通常只需10分钟左右,输出结果几何结构清晰、一致性强,支持实时探索,如鼠标导航浏览。例如,用户可以通过输入“未来城市街景”这样的文本提示,或上传一张未来城市的图片,快速生成一个完整的3D城市环境。
二、交互式编辑:实现结构与风格分离设计
Marble提供了Chisel实验性3D编辑器,用户可以先粗略勾勒空间布局,如墙壁、房间或地形,再用文本提示注入视觉风格。这种“结构分离风格”的设计类似于HTML与CSS的组合,避免了纯文本编辑的局限性。用户还可以一键扩展现有世界,或无缝组合多个场景,构建大型虚拟空间。
三、多格式导出:满足多种应用场景需求
Marble支持多种格式导出,包括Gaussian splats(高斯溅射)、三角网格或视频格式,适用于游戏、电影、VR等多种应用场景。这种灵活性使得Marble不仅能够满足个人用户的创作需求,还能为专业开发者提供强大的工具支持。
Marble的发布引起了广泛关注。Y Combinator CEO Garry Tan称其为“意义重大的发布”,认为它大幅降低了3D内容制作的门槛。然而,也有部分行业人士对生成式AI在游戏等领域的应用提出了质疑,担心其可能带来的知识产权侵权、能源消耗过高等问题。尽管如此,Marble的公测无疑为AI生成内容领域带来了新的机遇和挑战。


