AniSora V3：Bilibili开源动漫视频生成模型，助力动漫创作新时代

3D与动画 AI开源项目视频生成

一款专注于动漫视频生成的人工智能工具，旨在通过优化生成质量、动作流畅度和风格多样性，为动漫、漫画及VTuber内容创作者提供更强大的创作支持。

链接直达手机查看

Bilibili开源动漫视频生成模型AniSora V3是B站推出的一款专注于动漫视频生成的人工智能工具，旨在通过优化生成质量、动作流畅度和风格多样性，为动漫、漫画及VTuber内容创作者提供更强大的创作支持。

一、主要功能

AniSora V3具备以下核心功能：

一键生成多种风格的动漫视频：支持生成包括番剧片段、国创动画、漫画视频改编、VTuber内容及恶搞动画等多种风格的视频。
单图转视频：用户上传一张高质量动漫图像并配合文本提示，即可生成动态视频，保持角色细节和风格一致。
漫画改编：从漫画帧生成带唇部同步和动作的动画，适合快速制作预告片或短篇动画。
实时角色动画生成：支持实时生成角色动画，助力独立创作者和游戏开发者快速测试角色动作。
高分辨率输出：生成视频支持高达1080p分辨率，确保在社交媒体和流媒体平台上的专业呈现。

二、技术原理

AniSora V3基于Bilibili此前开源的CogVideoX-5B和Wan2.1-14B模型，结合强化学习与人类反馈（RLHF）框架，显著提升了生成视频的视觉质量和动作一致性。其关键技术包括：

时空掩码模块优化：增强了时空控制能力，支持更复杂的动画任务，如精细的角色表情控制、动态镜头移动和局部图像引导生成。
数据集扩展：依托超过1000万高质量动漫视频片段进行训练，新增数据清洗流水线，确保生成内容的风格一致性和细节丰富度。
硬件优化：新增对华为Ascend910B NPU的原生支持，推理速度提升约20%，生成4秒高清视频仅需2-3分钟。
多任务学习：强化了多任务处理能力，支持从单帧图像生成视频、关键帧插值到唇部同步等功能。
人类偏好强化学习：通过AnimeReward和GAPO等工具对模型进行微调，确保输出更符合人类审美和动漫风格需求。

三、应用场景

AniSora V3覆盖了90%的动漫视频应用场景，具体包括：

动漫创作：帮助创作者快速生成高质量的动漫视频内容，降低创作门槛。
漫画改编：将静态漫画转化为动态视频，适合制作预告片或短篇动画。
VTuber内容创作：支持实时生成角色动画，助力虚拟主播快速测试和优化角色动作。
游戏开发：为游戏开发者提供角色动画生成支持，加速游戏开发流程。

四、使用方法

用户需要填写申请表并发送至指定邮箱（如yangsiqian@bilibili.com）以获取V2.0权重和完整数据集访问权限。获取权限后，用户可以通过以下步骤使用AniSora V3：

上传高质量的动漫图像或漫画帧。
提供详细的文本提示，描述期望的视频内容（如角色动作、场景变化等）。
模型根据输入生成动态视频，用户可以进一步调整和优化生成结果。

五、适用人群

AniSora V3适用于以下人群：

动漫创作者：包括独立动画师、工作室和大型动漫制作公司。
漫画家：希望将漫画内容转化为动态视频的创作者。
VTuber和虚拟内容创作者：需要快速生成角色动画的虚拟主播和相关团队。
游戏开发者：需要高效生成角色动画以加速游戏开发的团队。

六、优缺点介绍

优点：

生成质量高：显著提升了视频的视觉质量和动作流畅度。
风格多样性：支持多种动漫风格，覆盖广泛的创作需求。
高效性：推理速度快，生成4秒高清视频仅需2-3分钟。
开源协作：鼓励社区开发者参与优化，推动模型持续改进。

缺点：

硬件要求高：虽然对国产芯片有优化，但仍然需要一定的硬件支持。
学习成本：对于非技术背景的创作者，可能需要一定时间来熟悉模型的使用方法。
版权问题：生成内容的版权归属和使用范围需要明确，以避免潜在的法律风险。

分类标签

开源工具、动漫创作、视频生成、AI技术、内容创作

相关导航

GPT-4o mini

GPT-4o mini是OpenAI推出的一款成本效益极高的小型模型，旨在通过降低智能技术的成本，使其更广泛地应用于各种领域。该模型在MMLU（Massive Multitask Language Understanding）基准测试中获得了82%的分数，并在LMSYS leaderboard的聊天偏好任务中超越了GPT-41，展现了其强大的性能。GPT-4o mini的定价为每百万输入令牌15美分，每百万输出令牌60美分，相比之前的尖端模型，其价格降低了一个数量级，且比GPT-3.5 Turbo便宜了超过60%。

llama3-Chinese-chat(llama3 中文版)

llama3-Chinese-chat是一个开源项目，旨在将强大的llama3模型引入中文世界，使机器能够理解和生成高质量的中文对话。该项目由名为“CrazyBoyM”的开发者主导，通过整合优化后的中文版本模型和一系列教程、资源、工具，为开发者和使用者提供了便利。

免责声明：本站为个人资讯、工具类学习博客，所发布的一切形式的内容，包括但不限于文字、链接、工具、图片、视频、软件等，仅限用于学习和研究目的，不得将上述内容用于商业或者非法用途，否则，一切后果请用户自负。本站信息来自网络，如有侵权请联系本站删除下架，您必须在下载后的24个小时之内，从您的电脑中彻底删除上述内容。访问和下载本站内容，说明您已同意上述条款。本站为非盈利性站点，本站不贩卖软件，所有内容不作为商业行为，点击、使用相关工具时请注意甄别，谨防上当受骗。咨询联系：yumiok88@gmail.com.