
近日,国内科技巨头腾讯携手清华大学、香港科技大学科研力量,共同发布了一款革命性的图生视频大模型——“Follow-Your-Click”。这一创新模型突破性地实现了基于用户点击图片指定区域及少量提示词输入,即可将静态图片的特定区域动态化,并一键转化为高质量视频内容。
当前市场上的图生视频技术普遍存在操作复杂度高、精准控制能力不足的问题。用户往往需要在提示词中详尽描述运动对象及其动作轨迹,然而即便如此,现有技术也难以精准操控图像中独立区域的动画效果,常导致整个场景联动移动而非局部精确变化。
针对上述痛点,“Follow-Your-Click”模型应运而生,它由腾讯混元大模型团队与清华、港科大的联合项目组联手研发,旨在提供更为实用且可控的解决方案,极大地简化了用户交互流程,真正意义上实现“一键点,万物动”的奇幻体验。
该图像到视频生成技术的应用前景广阔,将在电影制作、增强现实、游戏开发以及广告等多个领域推动AIGC(人工智能自动生成内容)的发展,成为2024年度最受瞩目的AI技术之一。
值得一提的是,腾讯混元大模型团队一直致力于多模态技术的研究和探索,其行业领先的视频生成能力早有卓越表现。此前,该团队曾作为《人民日报》的技术合作伙伴,成功运用先进技术助力打造原创视频《江山如此多娇》,生动展示了中国壮丽河山的精美画面,充分体现了腾讯混元大模型在内容理解、逻辑推理以及画面生成等方面的强大实力。
来源:新民晚报


