SadTalker:学习现实的3D运动系数风格化音频驱动的单图像说话的脸动画。
摘要 通过人脸图像和一段语音音频生成说话头视频仍然存在许多挑战。例如,不自然的头部运动,扭曲的表情和身份修改。我们认为这些问题主要是因为从耦合的二维运动场中学习。另一方面,明确使用3D信息也会遇到僵硬的表达和不连贯的视频问题。我们提出了SadTalker,它可以生成3英寸的3D运动系数(头部姿势,表情)。
Stable Video是一个基于AI的视频生成平台,旨在帮助用户将文本或图像转化为引人入胜的视频内容。该平台采用了领先的深度学习技术,能够快速高质量地生成各类视频,包括商业宣传、教学培训和演示等视频。用户只需提供相关内容,即可轻松创建出令人印象深刻的视频作品。【需要科学上网】【使用教程点击下方链接⬇⬇⬇】
YaFSDP是由俄罗斯科技巨头Yandex公司开源的一款大型语言模型(LLM)训练工具。它旨在通过优化GPU通信和减少内存使用量,来提高LLM训练的效率,并节省高达20%的GPU资源。
腾讯混元团队正式开源了InstantCharacter框架,这一基于扩散变换器的角色个性化工具,具备高一致性和灵活性,能够从单张图像生成多样化的角色定制,适用于多种艺术风格。
Caryn AI是一个将真实影响者转化为人工智能的平台,为用户提供个性化的互动体验。
SpicyChat AI 是一个聊天机器人平台,用户可以创建和与 AI 角色进行互动。
Vidu 是一款基于多智能体系统的 AI 视频生成工具,能够在分钟级时间内,根据背景音乐、参考图像和文本指令自动生成高质量 MV,实现从音乐解析到成片输出的全流程自动化。
Stable Video是一个基于AI的视频生成平台,旨在帮助用户将文本或图像转化为引人入胜的视频内容。该平台采用了领先的深度学习技术,能够快速高质量地生成各类视频,包括商业宣传、教学培训和演示等视频。用户只需提供相关内容,即可轻松创建出令人印象深刻的视频作品。【需要科学上网】【使用教程点击下方链接⬇⬇⬇】