可灵3.0全量开放:AI视频"导演级"创作时代正式到来

3月5日,快手旗下可灵AI正式宣布3.0系列模型全球全量开放,这一版本在视频生成、图片生成、动作控制三大核心能力上实现了全面突破,标志着AI技术从创作辅助工具正式迈入影视核心生产环节。与此同时,MiniMax旗下的海螺AI也发布了视频生成模型海螺2.3及全模态创作工具Media Agent,两大国产AI视频巨头的同台竞技,正在重新定义视频创作的边界与效率。

一、可灵3.0:覆盖影视级内容全流程生产

可灵3.0系列的升级绝非简单的参数调优,而是一次从"工具"到"协作伙伴"的质变。该版本涵盖了从图片生成、视频生成、编辑到后期制作的全流程,其中最引人注目的是智能分镜功能的引入——AI能够自动理解剧本内容,自主调度景别与机位,创作者只需输入文本描述,系统就能生成符合电影叙事逻辑的多镜头画面,实现真正意义上的"导演级"创作体验。在视频时长方面,可灵3.0将单次生成时长扩展至3至15秒,并支持多语种口型同步技术,让角色说话时的嘴型与发音精准匹配,大幅提升了视频的真实感和专业度。

在图片生成领域,可灵3.0引入了光影重构技术,输出画质可达2K甚至4K级别,并支持多达10张参考图的融合,为创作者提供了前所未有的创作自由度。而备受行业关注的动作控制3.0也在此次更新中迎来革命性升级——在动作、表情、口型、手势的一致性控制上实现了重大突破,尤其是在人物转头、侧脸、遮挡等复杂场景下的面部一致性表现显著提升,有效解决了AI视频长期以来"人物变形"的行业痛点。

Kling 2.6发布:ai视频创作进入音画同步新时代

二、海螺AI 2.3:动态表现力与全模态创作的双突破

几乎同一时间,上海AI独角兽企业MiniMax发布了视频生成模型海螺2.3及全模态创作工具Media Agent。据MiniMax介绍,海螺2.3在技术层面的最大亮点在于其强大的动态表现力——模型能够生成更具动感和戏剧张力的视频画面,在运动流畅度、场景复杂度和视觉冲击力上均有显著提升。同时,新模型在成本控制方面也有所突破,降低了高质量视频的生成成本,让更多创作者能够负担得起AI视频创作的费用。

全模态创作工具Media Agent的发布更是MiniMax在AI创作领域的一次大胆探索。这款工具打破了传统视频生成工具"单一模态"的局限,将文字、图片、视频、音频等多种内容形式纳入统一的创作流程,用户可以通过自然语言指令,在同一个平台上完成从脚本撰写、素材生成到视频剪辑的完整创作链条。这种"一站式"的创作模式,极大地降低了视频创作的门槛,让不具备专业影视制作技能的普通用户也能产出高质量的视觉内容。

Minimax通过港交所聆讯,ai独角兽凭什么这么牛?

三、商业化加速:可灵AI年化收入突破3亿美元

技术突破的背后,是AI视频赛道的商业化正在全面加速。快手科技创始人兼CEO程一笑在3月25日的财报电话会上披露,截至2026年1月,可灵AI的年化收入运行率(ARR)已超过3亿美元,并表达了今年实现收入同比翻倍以上增长的信心。这一数字不仅远超OpenAI旗下Sora的商业化表现,更标志着国产AI视频产品已经跑通了从技术到商业的完整闭环。方正证券的研报分析认为,国内互联网大厂在AI视频领域的集中发力,印证了2026年AI应用产业正步入景气上行通道。

Minimax海螺ai首尾帧功能双端上线,引领视频生成新潮流

然而,挑战同样存在。3月26日,快手港股股价单日收跌14%,市值跌破2000亿港元,反映出市场对AI商业化可持续性的担忧。与此同时,AI视频生成在短剧、影视、广告等领域的应用虽已起步,但在内容版权、深度伪造防范等方面仍缺乏完善的行业规范。随着可灵3.0和海螺2.3等产品的持续迭代,AI视频创作正从"能用"向"好用"迈进,但真正的行业变革,还需要技术、商业与法规的三重共振。

AD:精心整理了2000+好用的AI工具!点此获取

相关推荐

1 1

免费AI工具合集,点击进入

AI对话

玉米AI助手