9月11日,生数科技携手清华大学共同研发的视频大模型Vidu,宣布了其最新功能——“主体参照”。这一创新功能,旨在解决视频生成中角色形象一致性的问题,使得视频内容的生成更加稳定和可控。目前,该功能已向所有用户免费开放。
一、主体参照功能:角色形象的一致性保障
在AI生成的图片和视频中,角色形象的一致性一直是一个挑战。不同的生成结果可能导致同一角色在不同场景下形象不一,这在艺术创作中尤为突出。为了克服这一难题,业界曾尝试通过AI绘图工具生成分镜头画面,再将这些画面转化为视频。然而,这种方法不仅工作量大,而且限制了创作的灵活性。
Vidu的“主体参照”功能通过允许用户上传主体图片,实现了对任意主体形象的锁定。无论是人物、动物、商品,还是动漫角色,Vidu都能确保其在不同场景下的一致性,这在视频生成领域是一项重大创新。
二、AI视频创作的连贯性革命
中央广播电视总台导演石宇翔(森海荧光)利用“主体参照”功能创作了动画短片《夏日的礼物》。他指出,这一功能不仅提升了创作的连贯性,还大幅减少了生图工作量,使他能够专注于故事内容的创作。
三、Vidu的未来展望
生数科技董事长唐家渝表示,“主体参照”功能的推出,标志着AI视频创作向更高效、更灵活的阶段迈进。未来,Vidu将继续探索如何精确控制多主体交互、风格统一等复杂元素,以满足更高层次的叙事需求。他预见,一旦实现全面可控性,视频创作行业将迎来颠覆性的变革。