NeuralSVG是一种从文本提示生成矢量图形的隐式神经表示方法,能够生成具有有序和可编辑形状的矢量图形,并支持动态条件控制,如背景颜色等。
一种基于音频条件的潜在扩散模型的端到端唇同步框架,能够直接建模复杂的音视频关联.
一个新颖的框架,能够将2D视频转换为沉浸式立体3D视频,满足3D内容在沉浸式体验中日益增长的需求。
DisPose 是一种可控制的人体图像动画方法,它通过运动场引导和关键点对应来提高视频生成的质量。
CAP4D是一个能够利用任意数量的参考图像创建逼真4D化身的工具。
给定一个参考图像池,ColorFlow 能够为黑白图像序列中的各种元素(包括角色的头发颜色和服装)准确地生成颜色,并确保与参考图像的颜色一致性。
一款AI驱动的创新软件,能够将简单的文本描述或图像转化为逼真的3D渲染场景。
谷歌为开发者提供的一套用于构建增强现实(AR)和虚拟现实(VR)应用的工具集。
一项基于多模态联合训练的AI音频合成技术,能够根据视频或文本输入自动生成同步的音频效果。
一款先进的文本图像到视频生成模型,能够根据简单的文本输入和图像生成高质量的视频内容。
SAMURAI 是一种基于 Segment Anything Model 2 (SAM 2) 增强的视觉对象跟踪工具,它通过引入时间运动线索和运动感知记忆选择机制,实现了无需重新训练或微调的鲁棒、准确跟踪。
一项基于现有文本到图像模型的任务无关性框架,用于实现高质量的多任务图像生成。
一种用于3D对象迁移的技术,它能够将3D模型从一个软件环境无缝迁移到另一个,保持模型的完整性和兼容性。
项目旨在通过人工智能技术,创造一个无限广阔的数字宇宙,实现与现实世界相媲美的视觉效果和实时互动能力。
一个统一的可控视频生成方法,它能够实现在不同条件下精确且一致的视频操作,包括相机轨迹、文本提示和用户动作注释。
一项由字节跳动和清华大学联合开发的肖像动画技术,它能够将静态肖像图像和驱动表演视频结合起来,生成具有高度表现力和真实感的角色动画和视频。
FLUX.1-dev LoRA 服装生成器利用先进的人工智能技术,为用户带来前所未有的时尚设计体验,让设计小白也能秒出服装效果图。
Animode是阿里推出的AI动漫视频创作工具,基于3D技术帮助用户创建具有真实感的二次元角色和高质量视频效果。
Rive Layouts是Rive推出的新功能,它允许设计师和开发者创建动态的、适用于任何屏幕尺寸或设备的图形。
Blendbox是一款AI艺术创作工具,它通过层叠创作和非破坏性编辑功能,让用户在创作过程中拥有更多的创意控制力。
Wonder Dynamics是一款强大的视频编辑和动画制作软件,旨在为用户提供专业级别的视频处理能力。
Toy Box Flux 是一个利用AI生成图像训练的3D渲染模型,结合了3D LoRA模型和Coloring Book Flux LoRA的权重,形成了独特的风格,特别适合生成具有特定风格的玩具设计图像。
苹果最新推出的 AI 模型 Depth Pro 在深度估计领域取得重大突破,能快速生成高分辨率的3D深度图,无需相机元数据。该模型工作速度快,能捕捉微小细节,提供绝对深度估计,且开源共享。
一种3D虚拟试衣技术,它通过使用高斯散射(3DGS)作为3D表示,实现了从2D虚拟试衣模型到3D空间的知识转移,同时提高了跨视图的一致性。
一个能够从单张图片实时生成多样化3D场景的工具,它允许用户通过文本指定场景内容和通过摄像头移动指定生成位置。
GGHead是一种新颖的3D建模技术,由慕尼黑工业大学的Tobias Kirschstein等人研发。它能在超快速度下生成高质量、视角一致的3D人头模型,降低了3D建模门槛,为未来的人类建模研究开辟新可能性。
“神笔马良”是猫眼娱乐发布的AI工具,能够将长剧本一键转化为视听化呈现的动态故事板。
一款集数字人直播、视频智能创作、多角色对话于一体的AI驱动平台,旨在为企业和个人提供高度定制化的数字人解决方案。
MIMO是一个先进的视频合成模型,能够模仿任何人在复杂动作中与物体互动,生成具有高度真实感和交互性的视频内容。
PortraitGen 是由中国科学技术大学开发的,基于多模态生成先验的4D肖像视频编辑工具。
LVCD是一种基于参考的带有扩散模型的线性视频着色工具。
Lens Studio是Snapchat推出的一款增强现实(AR)创作工具,它允许用户创建和分享个性化的AR滤镜和体验。
Genspark 是一个专注于人工智能和机器学习模型开发的工具,旨在帮助用户快速构建、训练和部署AI模型。
SuperCraft是一款创新的AI设计工具,它利用先进的生成式AI技术,将手绘草图或文本提示直接转化为逼真的产品图像和3D模型,极大地简化了设计流程并提升了设计效率。
Meshy是一款高效、用户友好的AI 3D模型生成器,能够轻松将文本和图像转化为吸引人的3D模型。
Rendora是一款世界领先的3D AI虚拟形象生成工具,能够将文本快速转换成高质量的3D视频。
Glif是一个全面的无代码AI沙盒平台,支持构建AI工作流程、应用程序、聊天机器人及更多内容,提供多样化的创意与实用工具。
SkyReels是全球首个融合3D引擎与生成式AI的视频创作平台,能够将用户的想象即时转化为生动的视频内容。
Procreate是一款专为艺术家和插画家设计的,功能强大的数字绘画软件,特别适合在iPad等iOS设备上进行创意绘画和设计。
EmoTalk3D是一款集成情感识别与三维虚拟角色交互的创新性沟通工具,能够根据用户的语音或文本输入自动生成对应的情感表达,实现与虚拟角色的深度情感交流。
Dimension Studio是一款专业的3D渲染和可视化工具,专为设计师、建筑师、广告商及创意产业从业者打造,能够轻松创建高质量的三维图像和视频。
Stability AI最新推出的Stable Fast3D技术实现了从单张图像快速生成3D图像,处理速度比之前快1200倍,具有广泛的实用价值。该技术基于先进的生成式AI模型,为设计、建筑、零售、虚拟现实和游戏开发等多个行业带来革命性变革。
Easel AI是一款设计类应用,它利用人工智能技术简化设计流程,帮助用户即使没有专业设计技能也能通过简单的操作表达自己的风格,并快速分享给朋友。
DUSt3R是一种新颖的多视图立体重建(MVS)方法,它允许在没有任何相机参数(如内外参数)的情况下,对任意图像集合进行密集且无约束的立体3D重建。
Magic Insert Interactive Demo是一个在线交互式演示工具,它允许用户选择主题和背景,并将主题拖放到背景图像上,以创建合成图像。
Magnific AI是一个使用生成式AI技术实现极高分辨率图像上标的工具。它不仅可以实现极高分辨率,还可以根据用户的提示和参数添加更多细节。该工具可用于提高肖像、插图、视频游戏资产、风景照片等的分辨率和细节。
“寻光”是由阿里达摩院开发的一站式AI视频创作平台,它在2024年上海世界人工智能大会上亮相,并引起了广泛关注。该平台旨在通过人工智能技术,提供全新的视频创作模式,重塑传统视频制作的全流程。
MimicMotion是腾讯公司推出的一款人工智能人像动态视频生成框架,该框架利用先进的技术,能够根据用户提供的单个参考图像和一系列要模仿的姿势,生成高质量、姿势引导的人类动作视频。
科技巨头Meta震撼发布了其前沿AI创新成果Meta 3D Gen(简称3DGen),这一突破性技术能够在极短的时间内,即不足1分钟,迅速孕育出令人瞩目的高质量3D素材,极大地加速了创意内容生产的进程。
viggle.ai是一个基于人工智能的角色动态视频生成工具。它采用名为JST-1的视频-3D基础模型,赋予静态图像或视频中的角色以生命般的动态表现。Viggle.ai以其创新的功能和直观易用的界面,为创作者们提供了无限创意的可能性。
Moki是由美图公司推出的AI短片创作工具,专注于辅助视频创作者打造动画短片、网文短剧、故事绘本和音乐视频(MV)。它基于美图自研的奇想智能大模型(MiracleVision),提供智能剪辑、自动配乐、音效添加和字幕生成等功能。
AutoStudio是一个基于文本到图像(Text-to-Image, T2I)生成模型的多轮交互式图像生成框架。它由三个基于大型语言模型(Large Language Models, LLMs)的代理和一个基于稳定扩散(Stable Diffusion, SD)的代理组成,用于生成高质量的图像序列。
Freepik Designer是一个在线设计编辑器,允许用户无需专业设计技能或软件即可创建或编辑设计作品。它提供了大量的可编辑模板,支持AI工具和功能,如AI写作助手、背景移除、AI翻译器等,以简化工作流程。
Motiff 妙多涵盖全面的专业协同设计功能。 团队可在线协作,完成界面设计、设计系统管理、原型设计和研发交付。
一站式AI视频创作,1200+免费3D数字人。
AnimateAnyone是一个基于人工智能的角色动画生成工具,可以将静态图像转化为动态视频,实现角色的动画化。
ViViD 是一个创新的视频虚拟试穿框架,它利用扩散模型技术,结合服装编码器和姿态编码器,为用户提供逼真的视频试穿体验。
TryHairstyles.io是一个在线的发型设计平台,通过先进的人工智能技术,用户可以在上传照片后实时尝试各种流行发型和颜色,无需实际改变发型即可预览效果。
3DGen-Arena是由复旦大学和上海AI lab的研究人员开发的一个3D生成模型的人工评测竞技场。它旨在提供一个公开、匿名的平台,让用户对不同的3D生成模型进行比较和评价。
爱设计是一个在线设计平台,提供多种设计工具和资源,帮助用户快速制作出专业的设计作品。
NeuralSVG是一种从文本提示生成矢量图形的隐式神经表示方法,能够生成具有有序和可编辑形状的矢量图形,并支持动态条件控制,如背景颜色等。