在人工智能视频生成领域,谷歌DeepMind的最新力作——第二代AI视频生成模型Veo 2,以其卓越的4K分辨率和长达2分钟的视频生成能力,力压Sora模型,标志着视频生成技术的又一重大突破。
近日,科技巨头谷歌宣布了其最新的AI视频生成模型Veo 2的问世,这一创新成果在模拟现实世界的物理现象、人类动作及面部表情的细腻度上实现了质的飞跃,视频的整体观感有了显著提升。Veo 2模型具备强大的视频生成能力,它能够创造出4K分辨率(4096 x 2160像素)且时长可达2分钟的视频内容。与OpenAI的Sora模型相比,Veo 2的分辨率提升了4倍,视频时长增加了6倍。

Veo 2模型不仅能够在给定文本提示或文本和参考图像的情况下生成视频,还能更真实地模拟运动、流体动力学和光的属性。谷歌方面表示,Veo 2在真实感方面表现卓越,能够捕捉到人类表情和电影效果等细节。其增强的物理和电影学理解能力使用户能够生成令人惊叹的内容,包括跟踪镜头和广角构图等。
值得注意的是,Veo 2熟悉电影拍摄语言,用户可以要求某种类型的风格,指定镜头,建议电影效果,Veo 2都会以高达4K分辨率并延长到数分钟的视频长度来呈现。例如,要求“低角度跟踪镜头穿越场景中央”或“特写科学家通过显微镜观察”的镜头,Veo 2都能实现。

谷歌表示,虽然视频生成模型往往会“幻象化”出不需要的细节,例如多余的手指或意外的物体,但Veo 2在这一方面的表现更为真实,生成错误的频率较低。此外,Veo 2生成的视频包括不可见的SynthID水印,用于标记它们为AI生成的内容,从而减少误用或错误归属的风险。


