阿里巴巴ATH事业群于4月16日正式发布开放式世界模型产品Happy Oyster,这是一款支持实时生成动态三维环境与互动视频的AI工具。与传统文生视频工具不同,Happy Oyster基于原生多模态架构,可实现多模态输入与音视频联合生成的流式世界建模,让用户能够实时构建可交互、可演绎、可探索的AI数字世界。目前该产品已开启限量早期体验,用户可通过官网申请加入候补名单。
一、从生成视频到实时造世界
Happy Oyster由阿里ATH创新事业部团队打造,与此前爆火的HappyHorse同属一个团队。相比大语言模型相对成熟的模型架构和技术范式,世界模型仍属于前沿探索领域。阿里的Happy Oyster与谷歌的Genie3同属于世界模拟器流派。区别于传统文生视频模型输入Prompt、等待渲染、获得成片的被动流程,Happy Oyster采用长时间跨度上的世界演化建模方式。通过学习海量长视频数据,以及文本、动作指令、图像参考等多样控制信号,模型能够主动理解空间、物理与因果规律,预测情节和画面的演变,把被动生成内容转变为主动模拟世界演化,为构建可交互的通用世界模拟器提供了关键技术路径。
二、漫游与导演双模式:探索与创作并行
在产品能力上,Happy Oyster呈现出差异化优势。目前可实现漫游(Wander)和导演(Direct)两大核心功能。漫游模式支持1分钟连续位移与镜头控制,画面质量高、风格泛化强,用户可以在生成的3D世界中自由探索与移动。导演模式可实现3分钟以上480p/720p实时生成,用户可通过自然语言指令随时介入世界演化、调度角色事件,实现从被动探索到主动创作的跨越。当前双模式尚未完全融合,但未来将向边探索边创造演进。在技术实现上,Happy Oyster采用了时间跨度更长的世界演化建模方式,使得模型能够保持高保真、长时序的动态场景生成。
三、游戏与影视之外:世界模型打开新想象空间
目前,Happy Oyster已在游戏、影视、文旅及教育等领域展现应用潜力。在游戏开发领域,该工具可快速生成游戏地图、关卡原型和动态环境,大幅降低游戏开发成本,缩短创意验证周期。在影视制作领域,支持电影、电视剧等长视频内容生成,为影视创作者提供新的内容生产工具。用户生成的数字世界不仅能被完整保存,还能开放给其他用户进行二次创作,推动内容共创生态。阿里方面表示,该产品目前处于限量早期体验阶段,未来将持续迭代升级,推动世界模型技术的规模化应用。随着Happy Oyster的正式亮相,全球AI产业的世界模型竞争也将进入新的阶段。


