近日,北京快手科技有限公司宣布,其自主研发的视觉生成大模型可灵AI(Kling)API完成了新一轮的能力升级。此次升级在虚拟试穿和对口型两大功能上实现了显著进步,为电商、广告营销、泛娱乐及AI工具领域的客户提供了更为强大的技术支持。
一、对口型能力全面开放
可灵AI API的对口型能力现已全面开放,这意味着用户可以在可灵AI生成的人物视频上,上传自己的配音或歌唱,系统将自动实现音频与视频人物嘴型的精准同步。这一功能的开放,使得生成的视频内容更加生动,为视频创作带来了全新的可能。

二、虚拟试穿升级至V1.5模型
在虚拟试穿领域,可灵AI的V1.5模型不仅能够处理单个服装的输入,还新增了对“上装+下装”组合服装的支持。这一升级使得系统能够精确捕捉并保留服装的每一个细节,结合图生视频技术,提升了试穿体验的真实感。

三、技术进步的行业影响
这些技术进步将为电商、广告营销等领域的客户提供强大的支持,推动视觉内容的创新与发展。升级后的V1.5模型支持组合服装,提升虚拟试穿的真实感与实用性。同时,对口型能力的全面开放,实现视频人物口型与配音的完美同步,助力企业用户在业务增长上迈出新的步伐。

可灵AI的此次升级,不仅提升了用户体验,增强了艺术创作的灵活性和效率,还为AI技术在多元方向的持续突破提供了实践案例。随着AI技术的不断进步,我们有理由相信,未来将在技术创新、行业应用深化以及AI安全和伦理方面迎来新的挑战与机遇。


