Runway Gen-4.5 是 Runway 最新发布的视频生成模型,专为社交媒体短视频创作提供更高视觉一致性与创意控制。
PixVerse V5.5 是一款“一句话生成导演级音画同步高清视频”的 AI 视频创作平台。
智谱清影2.0是智谱AI推出的“文本→高清视频+自动音效”一体化生成工具,10 秒即可把一句话变成 1080P 乃至 4K 的完整短片,免费向个人与企业开放。
Claude Opus4.5 是 Anthropic 推出的最新旗舰混合推理 AI 模型,在编码、推理和长期任务管理方面表现卓越,同时大幅提升了安全性、效率与资源使用灵活性,能显著提高多类场景的生产力。
Magic Eraser 是一款基于 AI 的在线图片物体消除工具,可一键删除照片中不需要的元素。
腾讯元宝推出“一句话或一张图生成视频”的新功能,让零门槛创作高清短视频成为现实。
ElevenLabs 是一款集成图像生成、视频生成、声音合成、音乐创作与音效设计的一站式 AI 内容生产平台,依托多模态模型矩阵,为用户提供高效、高质量的内容创作解决方案,适配商业与个人创作场景。
腾讯推出的免费多模态平台,一键让图片人物“张嘴说话”,口型精准、画质高清。
快手官方出品的 AI 级移动端剪辑工具,让小白也能 3 分钟做出专业竖屏短视频。
Meta Vibes 是 Meta 推出的“零拍摄”AI 短视频生成与社交分享工具,用户只靠文字就能秒出片。
Sora Android版是由OpenAI推出的官方AI视频生成应用,支持在Android设备上通过文本、图片或视频输入快速生成高质量、音画同步的视频内容。
SkyReels V3 是昆仑万维推出的 AI 视频创作平台,聚合 Sora2、Veo3.1 等顶尖模型,支持多模态视频生成。
MoGA 是一种基于“混合分组注意力(Mixture-of-Groups Attention)”机制的高效 Transformer 变体,通过将输入序列动态划分为若干可学习的子组并并行计算组内-组间注意力,显著降低长序列推理成本,同时保持甚至提升下游任务精度。
Hailuo2.3 是 MiniMax 最新推出的旗舰级 AI 视频生成模型,用一句话即可生成 10 秒 1080P、电影级真实感与物理一致性的短片。
Freebeat AI:一句话介绍——“把任意音频/文字一键变成节奏同步的短视频,零剪辑也能出爆款”。
Veo 3.1 是谷歌最新发布的视频生成模型,在 8 秒到 60 秒的可控时长内一次性输出 1080P 画面与同步音轨,并支持插入删除对象、首尾帧过渡、角色一致性等电影级精细编辑。
OpenAI Sora 是一款“文生视频”大模型,输入文字即可一次性生成长达 60 秒、多角色、多机位、物理一致的高清视频。
LiblibAI 2.0 是中国最大的多模态模型社区推出的全新创作平台,集成图像、视频生成与模型训练于一体,支持免费算力与海量模型资源,旨在让创作者“零门槛”实现高质量AI创作。
Gaga.art 是一款基于 AI 的「一句话生成艺术海报」在线工具,输入任意中文或英文文案即可秒级产出可商用的高清视觉作品。
Spikes Studio 是一款基于 AI 的云端无代码视频生成与剪辑平台,可在几分钟内将文字、链接或素材自动转化为可发布的短视频。
Sora 是 OpenAI 推出的 AI 视频生成工具,现已在 iOS 端上线,支持文字/图片转视频及数字分身功能,但需通过邀请制或订阅 ChatGPT Plus/Pro 使用。
Synthesia 3.0 是全球领先的 AI 视频生成平台,通过“视频代理”与多语言虚拟形象,让企业与个人无需拍摄即可快速制作专业、互动、本地化的视频内容。
可灵2.5 Turbo 是一款集文本理解、动态生成与风格保持于一体的 AI 视频生成模型,以更低成本实现更出色的视频创作效果。
Sora2 是 OpenAI 推出的新一代“文本-音视频”同步生成模型,把好莱坞级短片制作流程压缩到 30 秒一键完成。
Vibes AI 是 Meta 推出的文本生成个性化短视频工具,可将用户输入的文字描述自动转化为带有“氛围感”的竖版短视频,适用于 Reels、快拍等社交场景。
Audio2Face 是英伟达推出的开源 AI 工具,可仅凭音频输入实时生成 3D 虚拟角色的面部动画,实现精准口型同步与自然表情。
Vidu Q2 是生数科技推出的新一代图生视频大模型,它通过突破细微表情生成技术,实现了从“视频生成”到“演技生成”的跨越,为内容创作、影视产业、广告营销等领域带来了全新升级。
Luma AI推出的Ray3视频生成模型是全球首个具备“推理能力”的AI视频生成模型,能够生成工作室级别的HDR视频,支持高达16-bit的高动态范围输出,为视频创作者提供了强大的工具。
VEED推出的Fabric 1.0是一款革命性的AI视频生成工具,它凭借强大的AI技术,为用户提供从文本到视频的高效创作体验,极大地简化了视频制作流程。
MyEdit 是一款基于 AI 的在线多媒体编辑工具,支持图片、音频、视频和文本的一站式快速处理,无需安装即可在浏览器中完成专业级创作。
快手 Kwali AI 视频制作助手是一款通过云端多 Agent 框架实现的高效视频创作工具,用户只需输入简单需求,即可快速生成高质量的短视频。
Infinite Talk 是一个由 MeiGen-ai 研发小组开源的数字人项目,能够生成无限长度的视频,具有准确的口型同步和一致的身份保留。
Wan2.2-S2V 是一款由阿里云开源的多模态视频生成模型,仅需一张静态图片和一段音频,即可生成面部表情自然、口型一致、肢体动作丝滑的电影级数字人视频。
智谱清影是智谱AI于2024年7月26日发布的AI视频生成工具,基于自研CogVideoX模型开发,支持通过文本或图片生成高清视频。
Remaker AI 是一款集成了 AI 换脸、AI 绘图及 AI 图像编辑功能的综合性创意平台,可满足用户主流的 AI 视觉创作需求。
SeaArt AI是一款基于人工智能技术的多功能创意平台,专注于通过AI生成高质量的数字艺术作品,集成了文本生成图像、图像编辑、视频生成等多种功能,旨在为用户提供一站式的创意解决方案。
HunyuanVideo-Foley是腾讯混元团队开源的端到端视频音效生成模型,能够根据输入的视频内容和文字描述,自动生成与画面高度匹配的高质量音效,为视频创作带来沉浸式体验。
PixVerse V5 是爱诗科技推出的新一代自研 AI 视频生成大模型,它在视频生成速度、质量以及创作灵活性上实现了飞跃提升,降低了创作门槛,推动了 AI 视频生成从专业工具向大众化创作的转型。
字节跳动新发布的 AI 视频模型 Waver 1.0,凭借其强大的多种艺术风格视频生成能力,为视频创作领域带来了全新的变革。
Google Vids 是 Google Workspace 家族里最新的 AI 影片创作工具,让任何人像做 PPT 一样在浏览器里 10 分钟做出带旁白、动画与品牌风格的完整影片。
DynamicFace是由小红书团队联合上海交通大学等机构推出的一种新型视频换脸技术,通过结合扩散模型和时间层,基于3D面部先验知识,实现高质量和一致性的视频换脸效果。
字节跳动发布的全球首个基于DiT大模型的“视频字幕无痕擦除”方案,能够高效、精准地去除视频中的字幕,同时保持视频画面的完整性和自然度,为视频后期处理提供了强大的技术支持。
SkyReels-A3 是一款基于多模态输入的端到端框架,能够合成高保真且时间连贯的人类视频,支持通过音频等多模态输入生成高质量的长视频内容。
万兴超媒Agent是万兴科技推出的一款基于AI技术的视频创作工具,能够实现从创意输入到成片输出的全流程自动化。
万兴天幕AI是国内首个音视频多媒体大模型,依托海量数据和先进AI技术,为创作者提供全链路创作支持,助力高效生成高质量音视频内容。
Moonvalley推出的Sketch-to-Video功能是一项革命性的AI视频生成技术,它允许用户仅通过简单的手绘草图和文本描述即可生成高质量的电影级视频片段。
通义千问3是阿里巴巴达摩院通义实验室发布的最新版本语言模型,具有强大的自然语言处理能力,支持多语言理解和生成,广泛应用于对话、文本生成、代码生成等场景。
Hedra 是一个结合实时互动虚拟形象和内容创作功能的平台,支持用户快速生成高质量的图像、视频和音频内容,广泛应用于客户服务、培训和营销等领域。
OpenAI Sora是一款由OpenAI开发的先进AI视频生成工具,能够根据文本描述生成高质量、连贯且具有丰富细节的视频内容。
GPT-5是OpenAI推出的下一代大型语言模型,具有更强的自然语言理解和生成能力,能够进行多语言文本生成、对话理解、代码编写、逻辑推理等。
阿里Wan 2.2是阿里巴巴云推出的一款开源AI视频生成模型,旨在通过强大的生成能力,为用户提供高质量的视频创作支持。
美图公司推出的AI影像Agent产品RoboNeo,是一款集图片精修、品牌设计、网页制作等多项功能于一体的AI智能体,通过自然语言交互方式,让用户能够通过“一句话指令”完成复杂的影像处理需求。
绘想是由百度推出的AI视频生成平台,基于百度自研的视频生成模型MuseSteamer,能够帮助用户快速生成高质量的视频内容。
百度自主研发的视频生成模型MuseSteamer,该模型是全球首个实现中文音视频一体化生成的视频模型。
一款专注于动漫视频生成的人工智能工具,旨在通过优化生成质量、动作流畅度和风格多样性,为动漫、漫画及VTuber内容创作者提供更强大的创作支持。
HeyGen AI视频Agent是一款强大的AI视频生成工具,能够通过简单的素材上传,自动完成从故事规划、脚本编写到镜头选择的整个视频制作流程,让用户在几分钟内即可获得可直接发布的专业级视频内容。
AI视频提示词撰写指南是一个帮助用户高效生成AI视频内容的工具,通过提供专业的提示词撰写方法和示例,让用户能够精确地指导AI生成高质量的视频。
Boximator 是一款由字节跳动研究团队开发的视频合成工具,能够根据用户提供的初始图像和文字描述生成具有丰富且可控动作的视频。
趣丸科技与香港中文大学(深圳)联合研发的开源文本转语音(TTS)模型,能够实现零样本语音合成,无需显式对齐信息和音素级时长预测,支持多种语言和情感控制。
RaskAI 是一款基于人工智能的视频本地化和配音工具,专为需要快速、高效地将视频内容翻译和配音成多种语言的创作者和企业提供服务 。
Runway Gen-4.5 是 Runway 最新发布的视频生成模型,专为社交媒体短视频创作提供更高视觉一致性与创意控制。