Rotato在线工具集是一个集成了多种实用在线工具的平台,旨在为用户提供便捷、高效的在线处理方案,覆盖从文本编辑、图片处理到文件转换等多种功能。
Stable Video 4D(SV4D)是由AI公司Stability AI推出的首个视频生视频模型。该模型能够将单个物体的单视角视频输入,转换成8个不同视角的多视角视频,为用户提供全视图3D动态视频体验。
清影 AI 视频生成服务是一个基于人工智能技术的创新平台,专注于通过智能算法快速生成高质量的视频内容。该服务以其高效、便捷和个性化的特点,适用于多种行业和场景,满足不同用户的需求。
GPT-4o mini是OpenAI推出的一款成本效益极高的小型模型,旨在通过降低智能技术的成本,使其更广泛地应用于各种领域。该模型在MMLU(Massive Multitask Language Understanding)基准测试中获得了82%的分数,并在LMSYS leaderboard的聊天偏好任务中超越了GPT-41,展现了其强大的性能。GPT-4o mini的定价为每百万输入令牌15美分,每百万输出令牌60美分,相比之前的尖端模型,其价格降低了一个数量级,且比GPT-3.5 Turbo便宜了超过60%。
EchoMimic是一款由蚂蚁集团研究团队推出的创新技术,能够根据音频内容和角色照片生成生动对口型视频。该技术突破了传统方法的局限性,实现了更逼真和动态的人像生成。
可灵AI是快手推出的新一代AI创意生产力平台,专注于为用户提供创意内容的生成与编辑服务
“寻光”是由阿里达摩院开发的一站式AI视频创作平台,它在2024年上海世界人工智能大会上亮相,并引起了广泛关注。该平台旨在通过人工智能技术,提供全新的视频创作模式,重塑传统视频制作的全流程。
MimicMotion是腾讯公司推出的一款人工智能人像动态视频生成框架,该框架利用先进的技术,能够根据用户提供的单个参考图像和一系列要模仿的姿势,生成高质量、姿势引导的人类动作视频。
VIMI 是由商汤科技推出的全球首个可控人物视频生成大模型 AIGC 产品。
viggle.ai是一个基于人工智能的角色动态视频生成工具。它采用名为JST-1的视频-3D基础模型,赋予静态图像或视频中的角色以生命般的动态表现。Viggle.ai以其创新的功能和直观易用的界面,为创作者们提供了无限创意的可能性。
Hedra是一个创新的创作实验室,致力于将基础模型转化为产品,以推动下一代人类叙事的发展。它提供了一个平台,让用户能够以全新的方式创造和分享视频内容。
RunwayML推出了Gen-3 Alpha,这是一款用于高保真、可控视频生成的新型模型。它是Runway基于为大规模多模态训练而构建的新基础设施训练的首批模型之一,与Gen-2相比,在保真度、一致性和动作上都有显著提升,是构建通用世界模型的重要一步。
WorldDreamer 是一个由清华大学团队开发的先进的视频生成模型,它能够全面理解视觉动态,并在多种场景下生成视频。这个模型在图像到视频合成、文本到视频生成、视频修复、视频风格化甚至动作到视频生成等方面表现出色。
Moki是由美图公司推出的AI短片创作工具,专注于辅助视频创作者打造动画短片、网文短剧、故事绘本和音乐视频(MV)。它基于美图自研的奇想智能大模型(MiracleVision),提供智能剪辑、自动配乐、音效添加和字幕生成等功能。
Hallo是由复旦大学开发的一项前沿技术,专注于肖像图像动画。它利用先进的扩散模型生成逼真且动态的肖像动画,与传统的参数模型相比,Hallo技术提供了更为自然和流畅的面部动作。
Dream Machine是一款基于AI的视频生成工具,能够根据文本和图像快速生成高质量、逼真的视频内容。
该工具能够从单一图像生成具有复杂面部表情和身体动作的虚拟人物,包括笑、说唱、唱歌、眨眼、微笑、说话等效果。
Follow-Your-Emoji是一个基于扩散模型的人像动画框架,能够将目标表情序列动画化到参考人像上,同时保持人像身份的一致性、表情的传递、时间的连贯性和保真度。它通过采用表情感知标志和面部细粒度损失技术,显著提升了模型在控制自由风格人像表情方面的表现,包括真实人物、卡通、雕塑甚至动物。此外,它还通过简单有效的逐步生成策略,扩展到稳定的长期动画,增加了其潜在的应用价值。
腾讯混元团队与中山大学、香港科技大学联合推出全新图生视频模型“Follow-Your-Pose-v2”,只需要输入一张人物图片和一段动作视频,就可以让图片上的人跟随视频上的动作动起来,生成视频长度可达10秒。
星火绘镜是一款由科大讯飞推出的AI短视频创作平台。这个平台允许用户轻松地从文字描述生成短视频内容,将文本转换为视频分镜,并扩展成完整的短视频。它特别适合需要快速将创意或故事转化为视频内容的用户,例如内容创作者、营销人员和教育工作者。
一站式AI视频创作,1200+免费3D数字人。
海艺 SeaArt AI是一个将文本或图像转换为图片或视频的AI绘图平台,旨在帮助用户将其想法通过图像或文本描述转化为AI生成的图片或视频。
AnimateAnyone是一个基于人工智能的角色动画生成工具,可以将静态图像转化为动态视频,实现角色的动画化。
SignLLM 是全球首个多语种手语视频生成模型,能够将文本或语音指令实时转化为手语视频,为听障人士提供沟通新方式。
Open-Sora是一个由hpcaitech开源的类Sora架构视频生成模型,它基于Diffusion Transformer(DiT)架构,旨在通过文本描述生成高质量的视频内容。该项目涵盖了整个视频生成模型的训练过程,包括数据处理、训练细节和模型检查点,供对文生视频模型感兴趣的人免费学习和使用。
该研究介绍了针对大型语言模型的无偏水印技术,表明可以添加水印而不影响生成文本的质量。研究提供了一个无偏水印的理论框架,确保输出不受水印的影响。这种方法为负责任的人工智能开发讨论提供了一个追踪和归因模型输出的方法,而不会牺牲质量。
Avid Technology(简称Avid)是一家提供专业音频和视频制作解决方案的公司,其产品和服务广泛应用于电影、电视、音乐制作和广播行业。
FIFO-Diffusion是一种基于预训练扩散模型的新型推理技术,用于无需训练即可从文本生成无限长的视频。
Viva 是一个免费的 AI 生成工具和社区,提供 Text-to-Image、Image-to-Image、Text-to-Video、Image-to-Video 等功能,以及强大的 AI 编辑工具。用户可以扩展图像、重新绘制任何内容,使图像和视频更加高质量和 4K。
SynthID作为一项创新的数字水印技术,能够对由AI生成的视频和文本进行标记。
Veo 可以捕捉不同的视觉和电影风格,包括风景和延时镜头,并对已生成的镜头进行编辑和调整。
Synthesia是一款基于人工智能的视频生成平台,通过文本输入,利用AI技术将文本转换为包含面部表情、语音和肢体语言的视频内容,极大提升了视频的表现力和吸引力。
准确识别视频中的语音,基于识别结果的文字选段随心裁剪视频片段。
美图AI消除是美图设计室提供的一项高级功能,旨在帮助用户去除图片中的不想要的元素,如水印和遮挡物。
美图秀秀是一款流行的图像和视频编辑应用程序。
StoryDiffusion是由字节跳动和南开大学合作推出的AI工具,专注于长范围图像和视频生成,通过一致性自注意力机制,实现图像和视频内容的连续性和一致性。
FaceAiSwap是一个提供AI人脸交换服务的在线平台。它允许用户将自己的脸部与喜欢的名人或朋友的脸部进行交换,为用户创造独特、有趣的图片内容。
DigenAI 数字人是一款创新的AI产品,其在数字互动方式革新和商务领域应用方面展现出巨大潜力。
Stability AI 推出了 Stable Artisan,这是一款支持使用 Developer Platform API 创建高质量媒体的 AI 工具,包含 Stable Diffusion 3 等高级模型,能够生成和编辑图像,并支持多种图像处理功能,以及用文字或图像创作精细视频。
通义千问的全民舞台功能是阿里通义实验室自研的人像视频生成模型EMO的一部分,允许用户通过上传人像图片配合音乐,生成个性化的AI视频MV。该功能集成了先进的AI技术,能够将人物表情、嘴型与歌曲韵律同步,创造出逼真的AI数字人视频。【请在手机应用商店中下载通义千问APP】
从Shutterstock下载最好的免版税图像,包括照片、矢量图、插图、视频、音乐等。
页面视频下载,播放记录批量下载,我喜欢的视频一键下载,博主所有视频一键下载
Vimego - 下载器在视频播放页、视频列表添加了“下载”按钮。选择您要下载的视频分辨率,点击即可下载视频。
帮助你轻松地将m3u8、直播、mp4、webm等在线视频保存到你的电脑中。
AIX智能下载器可高效实现下载管理,网页图片,视频,音频等内容的嗅探和下载,同时扩展集成多个网站的智能脚本,快速提取你想要的内容。
全网短视频去水印,抖音快手在线视频解析,去水印工具,去水印软件
下载 Twitter 视频,从 Twitter 保存 GIF 轻松将 Twitter 视频免费下载到 mp3、mp4
微博、秒拍、绿洲、小咖秀、晃咖视频图片在线解析下载工具支持解析微博和秒拍里的视频真实地址,解析出来的绿洲和小咖秀视频没有水印,并支持下载视频和视频封面到本地,手机和电脑上都适用,轻轻松松保存微博图片和视频到手机相册。
抖音视频解析工具是一款在线解析出无水印视频,还原视频本质免费下载
该账号在微博上分享与字幕制作相关的信息,发布字幕组的动态,以及招募新成员的通知。
。该方法通过多模态注意力机制,将视频和文本特征进行融合,并利用多语言翻译模型将不同语言的文本特征进行转换,从而实现跨语言的视频-文本检索。实验结果表明,该方法在多语言视频-文本检索任务上取得了较好的效果。
元象XVERSE 于2021年初在深圳成立,是国内领先的AI与3D技术服务公司,致力于打造AI驱动的3D内容生产与消费一站式平台,愿景为“定义你的世界”。
MuseV是一个基于扩散模型的虚拟人视频生成框架,它能够以无限长度和高保真度生成满足视觉条件的视频。
Blender 是一款功能强大的免费开源 3D 动画软件,支持建模、动画、渲染、模拟、合成、运动追踪和视频编辑等功能。它被广泛应用于电影、电视、游戏、广告、建筑和科学可视化等领域。
SadTalker:学习现实的3D运动系数风格化音频驱动的单图像说话的脸动画。
迅捷视频转换器在线免费版是一个多功能的在线媒体处理工具
MiraData 是一个具有长时长和结构化字幕 的大规模视频数据集。它专为长视频生成任务而设计。
通义实验室研发的 AI 模型 ——EMO 正式上线通义 App,并开放给所有用户免费使用。借助这一功能,用户可以在歌曲、热梗、表情包中任选一款模板,然后通过上传一张肖像照片就能让 EMO 合成演戏唱歌视频。
NeverEnds,强大的ai文字图片生成视频创作工具
HiDream.ai(智象未来)基于自研的、模型参数超过百亿的视觉多模态生成式基础模型,打造了面向广大设计师群体的 AI 创作工具和泛设计内容社区—— Pixeling(千象),不仅支持文生图、文生视频、视频编辑,还将支持图片编辑、图生视频、图生 3D 等功能。
Rotato在线工具集是一个集成了多种实用在线工具的平台,旨在为用户提供便捷、高效的在线处理方案,覆盖从文本编辑、图片处理到文件转换等多种功能。