可灵 AI 主体库上线,开启角色“永不变脸”新时代

近日,快手旗下的可灵 AI 正式发布「主体库」,为 O1 多模态视频模型添加了长期记忆能力,实现了角色一致性超过 96%,彻底解决了 AI 变脸问题。用户只需上传单张角色图,系统即可生成 3D 视角补全、多光线变体,并支持跨场景一键调用。

一、主体库三步流程:上传、补全、调用,提升角色一致性

主体库的操作流程简单高效,分为三个步骤:首先,用户可以上传 JPG、PNG、RAW 等格式的图片,系统会自动进行抠图、对齐、色彩归一等操作;接着,AI 会生成角色的侧脸、背面、局部细节等,并提供 3 组方案供用户选择;最后,在任意镜头、光照、风格下,用户只需输入「@角色名」即可调用该角色,保持其面孔与服饰细节的一致性。可灵 Ai 主体库上线,开启角色“永不变脸”新时代

二、AI 智能描述功能,让模型更懂创意

可灵 AI 的主体库还具备智能描述功能,系统能够自动提取「发色 + 服饰 + 风格」等信息并生成 60 字以内的关键词,用户可以根据需要进行二次编辑。实验表明,使用智能描述功能后,复杂场景一次生成成功率可提升 27%,平均节省 12 分钟手动调参时间。

三、主体库与 O1 模型统一入口,实现无缝衔接

主体库与 O1 模型的「文本生视频」「图像生视频」「首尾帧控制」功能共用底层 latent 空间,实现了文本 - 图像 - 视频的无缝衔接。同一角色在多段视频中连续出现时,ID 漂移小于 0.03,支持 48fps/1080p 输出,单条视频最长达 5 分钟。可灵 Ai 主体库上线,开启角色“永不变脸”新时代

四、行业冲击:短视频进入“一致性”时代

可灵 AI 主体库的上线,对多个行业产生了深远影响。影视预览方面,制片方可以利用主体库锁定主角造型,快速生成故事板,降低外景复拍成本;跨境电商领域,商家一次性上传模特图,即可批量产出多语种试穿视频,制作成本降至原来的 1/10;虚拟偶像行业,IP 方将虚拟形象存入库内,粉丝通过「@角色」即可生成二创视频,无需再担心角色“换脸”。可灵 Ai 主体库上线,开启角色“永不变脸”新时代

可灵 AI 主体库目前推出了免费版、Pro 版和 Enterprise API 版。免费版最多存储 5 个主体,每月 50 次调用;Pro 版 29 元 / 月,主体数无上限,赠送 600 次调用和 5 分钟高清生成;Enterprise API 版则按调用量计费,0.005 元 / 次,支持私有化部署与品牌定制。

AD:精心整理了2000+好用的AI工具!点此获取

相关推荐

1 1

免费AI工具合集,点击进入

AI对话

玉米AI助手