Wan2.2-Animate：通义万相全新动作生成模型

3D与动画创作与影视

通义万相全新动作生成模型 Wan2.2-Animate 正式开源，支持驱动人物、动漫形象和动物照片，可应用于短视频创作、舞蹈模板生成、动漫制作等领域。

链接直达手机查看

通义万相全新动作生成模型 Wan2.2-Animate 正式开源，支持驱动人物、动漫形象和动物照片，可应用于短视频创作、舞蹈模板生成、动漫制作等领域。
一、主要功能
动作模仿与角色扮演：支持动作模仿和角色扮演两种模式。在角色模仿模式下，输入一张角色图片和一段参考视频，模型可以将视频角色的动作和表情迁移到图片角色中；在角色扮演模式下，模型可以在保留原始视频的动作、表情及环境的基础上，将视频中的角色替换为图片中的角色。
高质量动作生成：在人物一致性、生成质量等指标上大幅提升，能够生成高质量的动作和表情。
光照融合：设计了独立的光照融合 LoRA 模块，用于保证角色与环境之间的完美光照融合效果。
二、技术原理
MoE 架构：采用业界首个视频生成 MoE（混合专家系统）架构，总参数量达 27B，激活参数 14B，通过高噪声专家模型负责场景布局、低噪声专家模型优化细节的分工模式，实现人物边缘轮廓与动作连贯性的精准控制。
统一表征：将角色信息、环境信息和动作等规范到统一的表示格式，实现了单一模型同时兼容两种推理模式。
骨骼信号与隐式特征：针对身体运动和脸部表情，分别使用骨骼信号和隐式特征，配合动作重定向模块，实现动作和表情的精准复刻。
三、应用场景
短视频创作：帮助创作者快速生成高质量的短视频内容，提升创作效率。
舞蹈模板生成：生成舞蹈动作模板，为舞蹈编排提供参考。
动漫制作：在动漫制作中实现角色动作的快速生成和替换，降低制作成本。
四、使用方法
下载模型：用户可以在 GitHub、HuggingFace 和魔搭社区下载模型和代码。
调用 API：通过阿里云百炼平台调用 API。
官网体验：在通义万相官网直接体验相关功能。
五、适用人群
视频创作者：为需要快速生成高质量视频内容的创作者提供强大的工具支持。
开发者：提供开源代码和详细的文档，方便开发者进行二次开发和集成。
研究人员：开源的模型和数据集为研究人员提供了研究视频生成技术的平台。
六、优缺点介绍
优点
高性能：在消费级 GPU 上即可运行，降低了硬件门槛。
功能丰富：支持多种生成任务，适用范围广泛。
开源开放：提供完整的代码和模型，方便开发者使用和改进。
缺点
训练资源要求高：虽然推理阶段对硬件要求不高，但训练阶段仍需要大量计算资源。
生成稳定性有限：在某些复杂场景下，生成的视频可能不够稳定。
分类标签
开源工具、视频生成、AI 模型、多语言支持、内容创作

相关导航

阿里巴巴Animate Anyone2：高保真角色动画生成技术

能够实现视频中人物的精准替换和动作表情的无缝迁移，为创意设计和影视制作提供强大的技术支持。

SkyReels-A3：超长音频驱动视频生成框架

SkyReels-A3 是一款基于多模态输入的端到端框架，能够合成高保真且时间连贯的人类视频，支持通过音频等多模态输入生成高质量的长视频内容。

ML Blocks

ML Blocks让您能够构建基于AI的图像生成和分析工作流程，无需编写任何代码。您可以使用稳定扩散等AI模型生成或修复图像，还可以通过检测或分割模型从图像中提取数据。

B站“代号H”AI创作工具：助力视频播客创作的高效利器

B站即将推出的“代号H”AI创作工具是一款专为播客创作者设计的高效创作辅助工具，能够显著节省视频素材查找和剪辑的时间。

免责声明：本站为个人资讯、工具类学习博客，所发布的一切形式的内容，包括但不限于文字、链接、工具、图片、视频、软件等，仅限用于学习和研究目的，不得将上述内容用于商业或者非法用途，否则，一切后果请用户自负。本站信息来自网络，如有侵权请联系本站删除下架，您必须在下载后的24个小时之内，从您的电脑中彻底删除上述内容。访问和下载本站内容，说明您已同意上述条款。本站为非盈利性站点，本站不贩卖软件，所有内容不作为商业行为，点击、使用相关工具时请注意甄别，谨防上当受骗。咨询联系：yumiok88@gmail.com.