阿里通义开源的 6B 参数级 ControlNet 统一模型,用消费级显卡就能对图像生成进行像素级精准控制。
阿里巴巴通义实验室开源的 6B 参数 Z-Image 图像生成模型,采用单流 DiT 架构,支持中英双语文字渲染,显存占用低至 16GB,适用于消费级设备。
Claude Opus4.5 是 Anthropic 推出的最新旗舰混合推理 AI 模型,在编码、推理和长期任务管理方面表现卓越,同时大幅提升了安全性、效率与资源使用灵活性,能显著提高多类场景的生产力。
Nano Banana Pro 是一款基于 Gemini 3 Pro 架构打造的图像生成与编辑模型,可生成 4K 高清图像,具备多对象融合、专业图像控制等能力,还支持联网生成与双重水印验证功能。
ElevenLabs 是一款集成图像生成、视频生成、声音合成、音乐创作与音效设计的一站式 AI 内容生产平台,依托多模态模型矩阵,为用户提供高效、高质量的内容创作解决方案,适配商业与个人创作场景。
Comfy Cloud 是一款“打开浏览器就能用”的云端 Stable Diffusion 平台,把原本需要高配显卡、复杂环境的 AI 绘图流程简化成“点开即生成”。
Affinity V1.0 是 Canva 推出的完全免费、整合矢量绘图、图像处理与排版的专业设计套件,剑指 Adobe 订阅制。
造好物通过AI技术把“一句话、一张图”变成可量产的实物,实现“人人都能开工厂”。
Hailuo2.3 是 MiniMax 最新推出的旗舰级 AI 视频生成模型,用一句话即可生成 10 秒 1080P、电影级真实感与物理一致性的短片。
光速写作是作业帮旗下“好课帮助”推出的 AI 写作平台,可在 10 分钟内完成论文、报告、PPT 等全流程创作,显著提升写作效率。
LiblibAI 2.0 是中国最大的多模态模型社区推出的全新创作平台,集成图像、视频生成与模型训练于一体,支持免费算力与海量模型资源,旨在让创作者“零门槛”实现高质量AI创作。
苹果 Manzano 是首个在端侧实现“图像理解+图像生成”统一架构的多模态大模型,用一套参数同时完成“看懂图”和“画出图”。
腾讯混元图像 3.0 是全球参数量最大、支持世界知识推理与千字级语义理解的开源多模态图像生成模型,效果媲美顶尖闭源系统。
Vidu Q2 是生数科技推出的新一代图生视频大模型,它通过突破细微表情生成技术,实现了从“视频生成”到“演技生成”的跨越,为内容创作、影视产业、广告营销等领域带来了全新升级。
Nano Banana 是谷歌推出的 Gemini 2.5 Flash Image 多模态模型,擅长以极高一致性完成文本生成图像、图像编辑与多图融合任务,适合个人创作与商业设计。
字节跳动开源的一款图像生成模型,它首次将“风格驱动”与“主体驱动”两类原本对立的图像生成任务统一到单一模型中,实现了风格相似性与主体一致性的双重优化。
腾讯混元图像2.1(HunyuanImage 2.1)是腾讯最新发布的开源文生图大模型,支持原生2K高清生图,具备强大的复杂语义理解能力。
Seedream 4.0 是字节跳动推出的下一代多模态 AI 图像生成模型,集图像生成与编辑功能于一体,能精准理解用户指令,快速生成高质量图像。
谷歌 Nano Banana 官方 Prompt 模板是一套专为 Gemini 2.5 Flash Image 模型设计的图像生成提示词模板,帮助用户快速生成高质量、风格多样的图像内容。
Wan2.2-S2V 是一款由阿里云开源的多模态视频生成模型,仅需一张静态图片和一段音频,即可生成面部表情自然、口型一致、肢体动作丝滑的电影级数字人视频。
OmniGen是由北京智源人工智能研究院开发的新一代统一图像生成模型,能够处理多种图像生成任务,包括文本到图像生成、图像编辑等。
CoMPaSS-FLUX.1是一种基于FLUX.1文本到图像扩散模型的LoRA适配器,可显著提升生成图像时对物体空间关系的理解能力。
STARFlow 是苹果公司推出的一种新型 AI 图像生成技术,旨在挑战当前主流的扩散模型,高效生成高分辨率图像。
SeaArt AI是一款基于人工智能技术的多功能创意平台,专注于通过AI生成高质量的数字艺术作品,集成了文本生成图像、图像编辑、视频生成等多种功能,旨在为用户提供一站式的创意解决方案。
PixVerse V5 是爱诗科技推出的新一代自研 AI 视频生成大模型,它在视频生成速度、质量以及创作灵活性上实现了飞跃提升,降低了创作门槛,推动了 AI 视频生成从专业工具向大众化创作的转型。
Qwen-Image-Edit 是阿里通义千问团队推出的图像编辑模型,凭借其强大的文本编辑能力和双重编码机制,在中文渲染和图像编辑领域表现出色,具有广泛的应用前景。
次元捏造局是一款专注于角色创作与动画制作的工具,它以强大的角色生成、自定义和动画制作功能,帮助创作者快速构建属于自己的动画角色和故事。
Skywork UniPic 2.0 是昆仑万维开源的高效多模态生成与编辑模型,集图像理解、生成和编辑能力于一体,旨在实现高效、高质、统一的多模态建模。
Nano-Banana是一款强大的图像编辑AI模型,以其卓越的角色还原、场景重构和图像融合能力在图像编辑领域脱颖而出。
月匣是一款专注于AI图像生成与角色风格统一的工具,通过一次设定即可在所有图像中保持角色风格的统一。
Qwen-Image 是一款强大的图像生成与编辑基础模型,能够实现复杂的文字渲染和精准的图像编辑,尤其在中文文字渲染方面表现出色,适用于多种艺术风格和应用场景。
万兴天幕AI是国内首个音视频多媒体大模型,依托海量数据和先进AI技术,为创作者提供全链路创作支持,助力高效生成高质量音视频内容。
通义千问3是阿里巴巴达摩院通义实验室发布的最新版本语言模型,具有强大的自然语言处理能力,支持多语言理解和生成,广泛应用于对话、文本生成、代码生成等场景。
Hedra 是一个结合实时互动虚拟形象和内容创作功能的平台,支持用户快速生成高质量的图像、视频和音频内容,广泛应用于客户服务、培训和营销等领域。
GPT-5是OpenAI推出的下一代大型语言模型,具有更强的自然语言理解和生成能力,能够进行多语言文本生成、对话理解、代码编写、逻辑推理等。
Holopix AI 是一款专为游戏设计、动漫、插画设计等领域打造的在线 AI 绘图创作平台,通过多模态创作、模型定制和全流程辅助等功能,为用户提供高效、专业的创作体验。
百度网盘AI相机是百度网盘与百度文库联合推出的一款集拍摄、存储、管理、处理于一体的智能影像工具,旨在为用户提供一站式的全模态影像服务。
Qwen VLo是由阿里云通义千问发布的多模态统一理解与生成模型,它不仅能够“看懂”世界,更能基于理解进行高质量的再创造,真正实现了从感知到生成的跨越。
谷歌 Imagen 4 是一款先进的 AI 图像生成模型,能够基于文本描述快速生成高质量、高分辨率的图像。
字节跳动豆包大模型团队推出的一款通用图像编辑模型,用户仅需输入简单的自然语言指令,就能实现专业级的图像编辑效果。
基于人工智能技术的图像处理软件,能够自动识别照片中的各种元素,并提供一键式优化和修复功能,让照片焕然一新。
字节跳动旗下剪映推出的智能创作Agent,基于AI技术,用户仅需输入一句指令,即可快速生成视频、数字人口播视频、设计图和图片换背景等内容。
集搜索、写作、对话、文档分析、图片生成、PPT制作等多功能于一体的全能型人工智能助手,能够为用户提供高效、便捷的智能服务。
字节跳动开源的一个多模态基础模型,拥有70亿活跃参数(总计140亿),在大规模交错多模态数据上进行训练,其在多模态理解排行榜上超越了当前顶级开源视觉语言模型,如Qwen2.5-VL和InternVL-2.5,并且在文本到图像生成质量上与强大的专业生成器如SD3相当。
腾讯元宝是腾讯推出的一款集AI搜索、文档处理、内容创作等多功能于一体的智能助手工具。
由腾讯推出的基于AI技术的图像生成与编辑工具,能够根据用户输入的文本描述生成高质量的图像内容。
一站式AI解决方案平台,提供多种基于大模型能力的定制化AI应用服务,涵盖代码开发、搜索问答、金融问答、IP角色扮演、表情包生成、图片理解等多个领域,助力企业和开发者提升效率和创新能力。
图像定制的统一框架,能够实现多种图像生成任务,如人物定制、风格转换、虚拟试穿等。
一款能够快速将图片转化为适用于多种 AI 绘图模型的精准提示词的工具,极大地简化了 AI 绘图的准备工作。
Stepfun AI 团队推出的开源图像编辑模型,能够通过人工智能技术实现高效、智能的图像编辑与创作。
基于8亿参数的文本到图像扩散模型,专为集成到ComfyUI工作流设计,凭借其强大的控制能力与高效生成特性,迅速成为AI艺术创作社区的焦点。
腾讯混元团队正式开源了InstantCharacter框架,这一基于扩散变换器的角色个性化工具,具备高一致性和灵活性,能够从单张图像生成多样化的角色定制,适用于多种艺术风格。
基于ChatGPT 4o模型的在线工具,能够将文字描述或普通照片转化为吉卜力风格的插画,为创作者和粉丝提供梦幻般的艺术体验。
帮助用户高效生成故事、小说、推文、视频脚本、艺术图片、音乐等多种内容,同时支持文案创作、改写、润色、翻译、PPT制作等功能,满足内容创作者、职场人士和普通用户的多样化需求。
集视频创作、AI绘画、文本生成及智能问答于一体的多功能应用,能够根据用户输入的简单描述快速生成高质量的视频、图像和文本内容,满足内容创作者、营销人员及普通用户的多样化需求。
集创意生成、模型训练、资源分享于一体的 AI 平台,为用户提供从图片生成到视频创作等多种功能,助力个性化模型的快速实现。
多图像条件下的主体到图像生成模型,通过渐进式跨模态对齐和通用旋转位置嵌入,实现了高一致性和可控性的多主体生成。
基于OminiControl框架开发的AI艺术创作工具,它将OpenAI的GPT-4o艺术风格与FLUX.1模型相结合,能够高效生成高质量的艺术图像。
开源的图像生成基础模型,拥有 170 亿参数,能够在短时间内生成高质量的图像,达到行业领先的图像生成水平。
支持将图片转换为吉卜力风格,同时提供丰富的设计元素和工具,满足用户在多种场景下的设计需求。
阿里通义开源的 6B 参数级 ControlNet 统一模型,用消费级显卡就能对图像生成进行像素级精准控制。