2025年6月19日,AI图像生成领域的知名企业Midjourney宣布推出其首个AI视频生成模型V1,标志着该公司正式进军AI视频领域。V1模型主打图像到视频的转换功能,用户可以上传自己的图片,或者使用Midjourney其他模型生成的图像,系统将基于此生成四段五秒的视频。此外,用户还可以通过扩展功能将视频时长延长至最多21秒。
一、模型功能与操作模式
V1模型提供了多种自定义设置,以满足不同用户的需求。它分为自动模式和手动模式。在自动模式下,平台会根据用户生成的图片自动创建“动作提示词”,让画面动起来。而手动模式则允许用户输入具体的提示词,精确描述希望物体和场景如何运动。此外,V1还提供了“低运动”和“高运动”两种运动模式,用户可以根据需要选择适合的场景。
二、定价策略与服务模式
V1目前仅通过Discord平台的网页端提供服务。在定价方面,视频生成的收费是典型图像生成的8倍。用户可以通过订阅Midjourney每月10美元的基础套餐来体验该功能。对于每月60美元的专业套餐和每月120美元的超级套餐用户,公司还提供了“放松”模式,允许用户在该模式下享受无限次视频生成服务。
三、技术愿景与未来规划
Midjourney公司表示,V1的推出是其迈向“实时开放世界模拟”终极目标的关键一步。未来,公司计划进一步开发用于生成3D渲染的AI模型以及实时AI模型。这一技术愿景不仅展示了Midjourney在多媒体生成领域的完整技术布局,也表明其志在构建一个能够实时生成动态画面并与人类互动的虚拟世界。
四、面临的挑战与争议
尽管V1的推出受到了广泛关注,但Midjourney也面临着一些挑战和争议。就在V1发布前夕,该公司因版权问题被迪士尼和环球起诉,诉讼声称Midjourney的AI图像模型生成了描绘这些公司版权角色的图像。此外,V1目前还存在一些技术上的局限性,例如不支持自动添加背景音乐或环境音效,生成的视频片段之间无法做到故事连续等。