字节跳动Seed团队发布的新一代3D生成大模型,采用MoE架构,在几何生成、纹理材质两项核心指标均取得SOTA,API已上线火山引擎。
Anthropic推出的AI设计助手,由Claude Opus 4.7模型驱动,支持自然语言生成设计稿、原型、幻灯片等视觉作品
摹客3推出的AI原型设计工具,支持截图生成高保真设计稿(还原度90%)、对话生成多页设计稿、PRD文档一键生成、设计稿转代码等功能,完全免费公测中。
国内首款AI生成式CAD建模工具,支持文生3D和图生3D,生成模型自带完整特征历史,支持参数化编辑。
阿里ATH发布的世界模型产品,支持三维互动视频生成,可用于影视制作和游戏开发,目前处于限量早期体验阶段。
Midjourney V8.1 Alpha发布:标志性美学强势回归,2K HD速度提升3倍、成本降3倍,Image Prompts全面回归,当前仅Alpha测试
腾讯混元3D世界模型2.0开源!支持文字/图片/视频多模态生成可编辑3D世界,导出Mesh/3DGS/点云,无缝衔接Unity/UE游戏引擎。
全球首个专业级动画创作Agent工具,集成7个AI Agent协作完成动画全流程创作
Google Stitch 2026 年 3 月重大更新,AI 原生设计画布 + 语音交互 + 即时原型,重新定义设计协作。
Midjourney V8 是 2026 年 3 月推出的最新 AI 图像生成模型,生成速度提升 5 倍,原生支持 2K 高清渲染,为专业设计师和创作者带来更高效的工作流程。
全球领先的设计平台,2026 年全面转型 AI 驱动,计划 2027 年 IPO
苹果推出的 3D 生成大模型,单图秒变 3D,光影还原度提升 37%,为 AR 和 Vision Pro 提供高质量素材生成支持。
LingBot-World 是蚂蚁灵波科技开源的一款顶尖世界模型,它以可扩展数据引擎为驱动,能提供高保真、高动态且可实时交互的模拟环境,在视频质量、长时序一致性等多方面表现突出,适配多领域应用。
呜哩是阿里低调推出的 AIGC 创意设计生产力平台,集成通义千问图像模型全家桶,为创作者提供高效多元的创意生成解决方案,已正式开启测试。
腾讯混元 3D Studio 1.2 是腾讯推出的一款 3D 创作工具,当前处于公测阶段,通过新增笔刷交互与八视图生成等功能,提升 3D 建模的专业性和精准度,助力用户高效完成 3D 内容创作。
TRELLIS.2-4B 是微软开源的一款基于流匹配 Transformer 的大型 3D 生成模型,能够以单张图片为输入,快速生成具备高保真度、复杂拓扑结构和 PBR 材质的 3D 资产,适用于多种高精度 3D 建模场景。
腾讯混元世界模型 1.5 是国内首个开放实时互动体验的世界模型,能通过文字或图片快速生成可实时探索的互动虚拟世界,同时开源业内最全面的实时世界模型训练体系,为 AI 生成内容领域提供新可能。
「印你」是拓竹科技推出的全新 3D 手办生成器,依托腾讯混元 3D 3.0 大模型,支持用户上传一张图片快速生成高质量、可打印的 3D 模型,大幅简化 3D 手办制作流程。
商汤 Seko 2.0 是一款基于 AI 大模型打造的创编一体视频创作平台,支持用户通过自然语言输入创意,全流程智能生成 100 集以内的连贯视频内容,大幅降低视频制作门槛与成本。
Adobe Project Graph 是基于节点的视觉化编辑器,助力艺术家和设计师自定义创作流程、提升协作效率。
Meta 推出的 SAM3D 是 Segment Anything 系列最新开源模型,可通过单张 2D 照片快速生成高质量、物理正确的可交互 3D 模型,刷新空间理解 SOTA 水平。
SIMA2 是谷歌 DeepMind 基于 Gemini 模型推出的通用智能体,专注于在复杂 3D 虚拟世界中理解多模态指令、执行任务并通过自我学习持续进步。
Marble 是李飞飞团队旗下 World Labs 推出的首款商用 3D 世界模型,支持多类型输入生成可编辑 3D 环境,搭配内置 AI 编辑工具与主流 VR 设备兼容性,为各领域 3D 创作提供高效、便捷的全流程解决方案。
HeyGen Avatar IV 是一款仅需一张照片与一段声音即可在几秒内生成超逼真数字人/动画形象的一站式 AI 平台。
文心魔法漫画是百度推出的“一句话+一张照片即可2分钟生成连载漫画”的零门槛AI创作工具。
Affinity V1.0 是 Canva 推出的完全免费、整合矢量绘图、图像处理与排版的专业设计套件,剑指 Adobe 订阅制。
Blender 是一款永久免费、开源且跨平台的三维创作套件,用一台电脑就能完成从建模、动画到影视级渲染的完整流程。
造好物通过AI技术把“一句话、一张图”变成可量产的实物,实现“人人都能开工厂”。
MoGA 是一种基于“混合分组注意力(Mixture-of-Groups Attention)”机制的高效 Transformer 变体,通过将输入序列动态划分为若干可学习的子组并并行计算组内-组间注意力,显著降低长序列推理成本,同时保持甚至提升下游任务精度。
Seed 团队推出的单图→仿真级 3D 大模型,1.5 B 参数即可端到端输出精细几何、真实纹理与 PBR 材质,直接驱动具身智能与世界模拟。
KIRI Remy 3D App 是一款基于 3D 高斯泼溅算法、通过普通手机环绕拍摄即可在 5 分钟内生成可 360° 漫游的 Interactive Photo 并支持一键分享至鸿蒙图库与社交平台的 3D 影像记录应用。
LiblibAI 2.0 是中国最大的多模态模型社区推出的全新创作平台,集成图像、视频生成与模型训练于一体,支持免费算力与海量模型资源,旨在让创作者“零门槛”实现高质量AI创作。
Gaga.art 是一款基于 AI 的「一句话生成艺术海报」在线工具,输入任意中文或英文文案即可秒级产出可商用的高清视觉作品。
VideoFrom3D 是一个把静态 3D 模型一键变成「可交互 360° 展示视频」的在线工具,无需安装软件,打开浏览器就能生成高清旋转展示片。
Audio2Face 是英伟达推出的开源 AI 工具,可仅凭音频输入实时生成 3D 虚拟角色的面部动画,实现精准口型同步与自然表情。
Vidu Q2 是生数科技推出的新一代图生视频大模型,它通过突破细微表情生成技术,实现了从“视频生成”到“演技生成”的跨越,为内容创作、影视产业、广告营销等领域带来了全新升级。
上传一张图、一段参考视频,就能让角色“活”起来或把原片人物换成新角色,同时保持表情、动作、光影一致的开源 AI 视频神器。
通义万相全新动作生成模型 Wan2.2-Animate 正式开源,支持驱动人物、动漫形象和动物照片,可应用于短视频创作、舞蹈模板生成、动漫制作等领域。
VEED推出的Fabric 1.0是一款革命性的AI视频生成工具,它凭借强大的AI技术,为用户提供从文本到视频的高效创作体验,极大地简化了视频制作流程。
拓竹科技的 3D 打印机是一系列集高精度、智能化、多功能于一体的先进设备,能够为用户提供高效、便捷的 3D 打印体验。
Nano Banana 是谷歌推出的 Gemini 2.5 Flash Image 多模态模型,擅长以极高一致性完成文本生成图像、图像编辑与多图融合任务,适合个人创作与商业设计。
MyEdit 是一款基于 AI 的在线多媒体编辑工具,支持图片、音频、视频和文本的一站式快速处理,无需安装即可在浏览器中完成专业级创作。
GUAVA 是由清华大学深圳国际研究生院和 IDEA 联合提出的用于快速可动画的上半身 3D 高斯形象重建框架。
MasterGo AI是由北京尽微致广技术有限公司开发的AI驱动的企业级产品设计平台,深度融合AI技术与设计系统,支持从产品原型设计、UI/UX交互设计到前端代码生成的全流程智能化协作,旨在帮助团队提升设计效率、降低沟通成本,实现“设计即开发”的闭环体验。
HunyuanWorld-Voyager是由腾讯混元团队开源的3D生成工具,能通过单张照片或文字描述快速生成360°沉浸式3D场景,为用户带来全新的视觉体验。
SeaArt AI是一款基于人工智能技术的多功能创意平台,专注于通过AI生成高质量的数字艺术作品,集成了文本生成图像、图像编辑、视频生成等多种功能,旨在为用户提供一站式的创意解决方案。
OmniHuman-1.5是字节跳动推出的多模态数字人方案,通过单张图像与音频输入生成高度逼真的动态视频,广泛应用于影视制作、虚拟主播、教育培训等领域。
Genspark AI Designer是一款能够通过单一自然语言指令快速生成品牌Logo、包装、网站设计、室内装饰等全链路创意解决方案的AI设计工具。
Google Vids 是 Google Workspace 家族里最新的 AI 影片创作工具,让任何人像做 PPT 一样在浏览器里 10 分钟做出带旁白、动画与品牌风格的完整影片。
GUAVA是由清华大学深圳国际研究生院和IDEA联合提出的用于快速可动画的上半身3D高斯形象重建框架。
ToonComposer是一款利用人工智能技术简化动漫制作流程的工具,能够实现自动上色和生成动画,大幅提升动漫创作效率。
次元捏造局是一款专注于角色创作与动画制作的工具,它以强大的角色生成、自定义和动画制作功能,帮助创作者快速构建属于自己的动画角色和故事。
CharaLab是一款免费的在线AI角色生成工具,能够根据用户输入的文字描述或上传的照片生成各种风格的AI角色,满足创作者在故事、游戏或个人项目中的角色设计需求。
Matrix-3D 是一个开源工具,能够从单张图片或文本提示生成大规模可探索的 3D 场景,支持全景视频生成和 3D 场景重建,具有高可控性和强大的泛化能力。
BlenderFusion是一款结合3D几何控制和生成式合成技术的视觉编辑工具,能够实现精准的几何编辑和灵活的视觉合成,解决了传统基于文本控制的视觉合成任务中几何级指令难以精确执行的问题。
SkyReels-A3 是一款基于多模态输入的端到端框架,能够合成高保真且时间连贯的人类视频,支持通过音频等多模态输入生成高质量的长视频内容。
月匣是一款专注于AI图像生成与角色风格统一的工具,通过一次设定即可在所有图像中保持角色风格的统一。
Moonvalley推出的Sketch-to-Video功能是一项革命性的AI视频生成技术,它允许用户仅通过简单的手绘草图和文本描述即可生成高质量的电影级视频片段。
Fogsight是一款基于大型语言模型(LLM)的AI动画引擎,能够将用户输入的抽象概念或关键词快速转化为高质量的叙事动画。
字节跳动Seed团队发布的新一代3D生成大模型,采用MoE架构,在几何生成、纹理材质两项核心指标均取得SOTA,API已上线火山引擎。