智谱清影2.0是智谱AI推出的“文本→高清视频+自动音效”一体化生成工具,10 秒即可把一句话变成 1080P 乃至 4K 的完整短片,免费向个人与企业开放。
快手官方出品的 AI 级移动端剪辑工具,让小白也能 3 分钟做出专业竖屏短视频。
Firecrawl Branding Format API 是一款“一键提取任意网站完整品牌 DNA”的云端接口服务。
我们专注于高分电影的深度拆解,提供叙事结构、角色弧光、主题对标、经典台词等一站式分析。旨在帮助编剧、导演等影视从业者及影视专业学生,系统化汲取创作营养,精准定位参考范本,让好故事的诞生有迹可循!
Blender 是一款永久免费、开源且跨平台的三维创作套件,用一台电脑就能完成从建模、动画到影视级渲染的完整流程。
MoGA 是一种基于“混合分组注意力(Mixture-of-Groups Attention)”机制的高效 Transformer 变体,通过将输入序列动态划分为若干可学习的子组并并行计算组内-组间注意力,显著降低长序列推理成本,同时保持甚至提升下游任务精度。
Hailuo2.3 是 MiniMax 最新推出的旗舰级 AI 视频生成模型,用一句话即可生成 10 秒 1080P、电影级真实感与物理一致性的短片。
Veo 3.1 是谷歌最新发布的视频生成模型,在 8 秒到 60 秒的可控时长内一次性输出 1080P 画面与同步音轨,并支持插入删除对象、首尾帧过渡、角色一致性等电影级精细编辑。
FaceCLIP 是字节跳动开源在 Hugging Face 的 CLIP-风格人脸表征模型,用图文对比学习让机器“看得懂”人脸与文本的对应关系。
LiblibAI 2.0 是中国最大的多模态模型社区推出的全新创作平台,集成图像、视频生成与模型训练于一体,支持免费算力与海量模型资源,旨在让创作者“零门槛”实现高质量AI创作。
Gaga.art 是一款基于 AI 的「一句话生成艺术海报」在线工具,输入任意中文或英文文案即可秒级产出可商用的高清视觉作品。
Spikes Studio 是一款基于 AI 的云端无代码视频生成与剪辑平台,可在几分钟内将文字、链接或素材自动转化为可发布的短视频。
Vibes AI 是 Meta 推出的文本生成个性化短视频工具,可将用户输入的文字描述自动转化为带有“氛围感”的竖版短视频,适用于 Reels、快拍等社交场景。
Google AI Studio Flow 是一个基于 Gemini 模型的可视化 AI 工作流搭建平台,让用户无需编码即可快速构建、测试和部署多步骤智能应用。
Vidu Q2 是生数科技推出的新一代图生视频大模型,它通过突破细微表情生成技术,实现了从“视频生成”到“演技生成”的跨越,为内容创作、影视产业、广告营销等领域带来了全新升级。
上传一张图、一段参考视频,就能让角色“活”起来或把原片人物换成新角色,同时保持表情、动作、光影一致的开源 AI 视频神器。
通义万相全新动作生成模型 Wan2.2-Animate 正式开源,支持驱动人物、动漫形象和动物照片,可应用于短视频创作、舞蹈模板生成、动漫制作等领域。
VEED推出的Fabric 1.0是一款革命性的AI视频生成工具,它凭借强大的AI技术,为用户提供从文本到视频的高效创作体验,极大地简化了视频制作流程。
Nano Banana 是谷歌推出的 Gemini 2.5 Flash Image 多模态模型,擅长以极高一致性完成文本生成图像、图像编辑与多图融合任务,适合个人创作与商业设计。
Claude Web Fetch 是由 Anthropic 开发的 Claude API 的一项新功能,能够从任意网页 URL 和 PDF 中获取并分析内容,无需额外的基础设施。
快手 Kwali AI 视频制作助手是一款通过云端多 Agent 框架实现的高效视频创作工具,用户只需输入简单需求,即可快速生成高质量的短视频。
Statsig 是一款集功能管理、实验、分析与会话回放于一体的现代化产品开发平台,可助力团队快速迭代、科学决策。
谷歌 Gemini API 的 URL Context 功能允许开发者通过 API 直接传入网页链接,模型自动解析内容并生成结构化数据,极大地简化了网页数据抓取和处理的流程。
HunyuanWorld-Voyager是由腾讯混元团队开源的3D生成工具,能通过单张照片或文字描述快速生成360°沉浸式3D场景,为用户带来全新的视觉体验。
Remaker AI 是一款集成了 AI 换脸、AI 绘图及 AI 图像编辑功能的综合性创意平台,可满足用户主流的 AI 视觉创作需求。
SeaArt AI是一款基于人工智能技术的多功能创意平台,专注于通过AI生成高质量的数字艺术作品,集成了文本生成图像、图像编辑、视频生成等多种功能,旨在为用户提供一站式的创意解决方案。
HunyuanVideo-Foley是腾讯混元团队开源的端到端视频音效生成模型,能够根据输入的视频内容和文字描述,自动生成与画面高度匹配的高质量音效,为视频创作带来沉浸式体验。
PixVerse V5 是爱诗科技推出的新一代自研 AI 视频生成大模型,它在视频生成速度、质量以及创作灵活性上实现了飞跃提升,降低了创作门槛,推动了 AI 视频生成从专业工具向大众化创作的转型。
OmniHuman-1.5是字节跳动推出的多模态数字人方案,通过单张图像与音频输入生成高度逼真的动态视频,广泛应用于影视制作、虚拟主播、教育培训等领域。
Google Vids 是 Google Workspace 家族里最新的 AI 影片创作工具,让任何人像做 PPT 一样在浏览器里 10 分钟做出带旁白、动画与品牌风格的完整影片。
ElevenLabs 最新推出的视频到音乐生成工具是一项突破性功能,允许用户基于视频的上下文自动生成定制化配乐。用户只需上传视频,AI 模型便能分析其内容、情感和节奏,生成与视频风格高度契合的音乐,包括旋律、和声及歌词。
ToonComposer是一款利用人工智能技术简化动漫制作流程的工具,能够实现自动上色和生成动画,大幅提升动漫创作效率。
DynamicFace是由小红书团队联合上海交通大学等机构推出的一种新型视频换脸技术,通过结合扩散模型和时间层,基于3D面部先验知识,实现高质量和一致性的视频换脸效果。
CharaLab是一款免费的在线AI角色生成工具,能够根据用户输入的文字描述或上传的照片生成各种风格的AI角色,满足创作者在故事、游戏或个人项目中的角色设计需求。
BrowserAct是一款由人工智能驱动的网页抓取工具,能够在无需编码的情况下从任何网站提取数据,为用户提供可扩展且经济实惠的解决方案。
Querri 是一款基于人工智能的数据平台,旨在通过自然语言处理技术,帮助用户快速、轻松地获取数据洞察,无需复杂的构建、编码或等待。
VizMind是一款专注于数据可视化的智能分析工具,通过先进的数据处理和可视化技术,帮助用户快速将复杂数据转化为直观易懂的图表和报告,提升数据分析效率和决策能力。
BlenderFusion是一款结合3D几何控制和生成式合成技术的视觉编辑工具,能够实现精准的几何编辑和灵活的视觉合成,解决了传统基于文本控制的视觉合成任务中几何级指令难以精确执行的问题。
SkyReels-A3 是一款基于多模态输入的端到端框架,能够合成高保真且时间连贯的人类视频,支持通过音频等多模态输入生成高质量的长视频内容。
月匣是一款专注于AI图像生成与角色风格统一的工具,通过一次设定即可在所有图像中保持角色风格的统一。
Claude Opus 4.1 是 Anthropic 推出的最新旗舰 AI 模型,专门针对复杂编程、自主任务和高级推理进行优化,能够显著提升编程效率和任务处理能力。
Moonvalley推出的Sketch-to-Video功能是一项革命性的AI视频生成技术,它允许用户仅通过简单的手绘草图和文本描述即可生成高质量的电影级视频片段。
Hedra 是一个结合实时互动虚拟形象和内容创作功能的平台,支持用户快速生成高质量的图像、视频和音频内容,广泛应用于客户服务、培训和营销等领域。
Holopix AI 是一款专为游戏设计、动漫、插画设计等领域打造的在线 AI 绘图创作平台,通过多模态创作、模型定制和全流程辅助等功能,为用户提供高效、专业的创作体验。
绘想是由百度推出的AI视频生成平台,基于百度自研的视频生成模型MuseSteamer,能够帮助用户快速生成高质量的视频内容。
百度自主研发的视频生成模型MuseSteamer,该模型是全球首个实现中文音视频一体化生成的视频模型。
B站即将推出的“代号H”AI创作工具是一款专为播客创作者设计的高效创作辅助工具,能够显著节省视频素材查找和剪辑的时间。
Stable Audio Open Small 是一款由 Stability AI 与 Arm 合作推出的轻量级文本到音频生成模型,专为移动设备优化,能够在本地快速生成高质量音频。
HeyGen AI视频Agent是一款强大的AI视频生成工具,能够通过简单的素材上传,自动完成从故事规划、脚本编写到镜头选择的整个视频制作流程,让用户在几分钟内即可获得可直接发布的专业级视频内容。
Firecrawl 是一款由 Mendable.ai 开发的开源 AI 爬虫工具,专门用于 Web 数据提取,并将其转换为适合大语言模型(LLM)处理的结构化数据。
Perplexity AI智能金融分析助手是一款专注于金融领域的智能分析工具,能够帮助用户快速获取金融市场信息并提供深度分析。
AI视频提示词撰写指南是一个帮助用户高效生成AI视频内容的工具,通过提供专业的提示词撰写方法和示例,让用户能够精确地指导AI生成高质量的视频。
Boximator 是一款由字节跳动研究团队开发的视频合成工具,能够根据用户提供的初始图像和文字描述生成具有丰富且可控动作的视频。
Seaweed APT2 是字节跳动最新推出的实时交互式视频生成模型,采用自回归对抗后训练(AAPT)技术,实现单 GPU 24fps 的长视频流式生成,支持虚拟人物与世界漫游互动。
Gartner是一家全球领先的信息技术研究和咨询公司,其工具主要用于分析和评估各种技术、市场和行业趋势,为企业的决策提供数据支持和战略建议。
谷歌 Imagen 4 是一款先进的 AI 图像生成模型,能够基于文本描述快速生成高质量、高分辨率的图像。
RaskAI 是一款基于人工智能的视频本地化和配音工具,专为需要快速、高效地将视频内容翻译和配音成多种语言的创作者和企业提供服务 。
强大的AI视频生成工具,可基于文本或图片快速生成高质量动态视频,满足不同用户创作需求。
ElevenLabs于2025年6月推出的最新文本转语音(TTS)模型的Alpha版本,被誉为“地表最强”的TTS模型。
为移动应用开发者提供应用商店分析、市场情报和销售前景服务的平台,帮助开发者优化应用表现和市场竞争力。
智谱清影2.0是智谱AI推出的“文本→高清视频+自动音效”一体化生成工具,10 秒即可把一句话变成 1080P 乃至 4K 的完整短片,免费向个人与企业开放。