谷歌 DeepMind 与布朗大学合作开发的“力提示”技术,能够在无需 3D 模型和物理引擎的情况下,通过指定力的方向和强度,生成逼真的运动效果。
从单张俯视图像生成逼真且连贯的3D场景,通过区域生成和空间感知3D修复技术,解决了现有方法在几何一致性、布局连贯性和纹理保真度方面的不足。
谷歌在2025年推出的革命性AI驱动的3D视频通信平台,旨在通过先进的AI技术和3D成像,将传统2D视频通话升级为沉浸式的3D体验。
Google Labs推出的实验性AI工具,能够将用户输入的问题或复杂概念快速转化为直观的动画短视频,帮助用户轻松理解复杂知识。
一站式AI解决方案平台,提供多种基于大模型能力的定制化AI应用服务,涵盖代码开发、搜索问答、金融问答、IP角色扮演、表情包生成、图片理解等多个领域,助力企业和开发者提升效率和创新能力。
致力于高保真度和可控性生成纹理化三维资产的开源框架,能够生成具有高精度几何形状和多样化纹理贴图的三维模型。
统一的三维摄影测量模型,能够执行包括姿态估计、深度预测和新视图合成在内的多种子任务,通过多模态扩散变换器(DiT)整合图像、相机参数和深度图等多种模态的转换。
创新的设计智能体平台,致力于通过人工智能技术为用户提供高效、个性化的设计解决方案,涵盖从平面设计到品牌塑造的多个领域。
旨在为用户提供高效、低代码的工程孪生场景构建与渲染解决方案。
腾讯 PCG 的人工智能与机器学习实验室,专注于计算机视觉、语音和自然语言处理等领域,致力于在语音/视频生成、增强、检索、理解以及 AutoML 等技术上进行探索、创新和突破。
高分辨率视频中唇部同步的稳健方法,能够解决唇部运动与音频对齐的问题,同时避免表情泄漏和面部遮挡问题。
理解和评估视频中相机运动的基准工具,旨在通过结合几何和语义信息,提升对视频中相机运动的理解和分析能力。
广泛应用于游戏开发和实时3D内容创作的跨平台引擎,以其强大的功能和广泛的社区支持,成为全球开发者的重要工具。
充满创意的视觉设计概念库,提供了一系列独特的主题和风格描述,为设计师、艺术家和创意工作者提供灵感和参考。
提供免费在线设计图片素材的正版商用素材图库平台,涵盖丰富的模板、图片、视频等资源,满足用户在设计、营销、办公等多场景下的素材需求。
用户只需上传一张图片并选择声音,即可让角色生动地说话、动作并表达情感,带来令人惊叹的真实感和流畅性。
腾讯混元3D是一款由腾讯推出的基于AI技术的3D创作工具,用户可以通过它轻松创建和编辑3D模型及场景。
无需调优的全向全景图像和视频生成工具,通过球形潜在表示实现高质量的 360 度全景内容生成。
基于云端的界面设计工具,支持多人实时协作,广泛应用于 UI/UX 设计、原型制作和团队协作。
昆仑万维SkyReels团队推出的一款无限时长电影生成模型,基于扩散强迫框架结合多模态大语言模型等技术,能够生成高质量、无限时长的视频内容。
专注于三维空间理解的大语言模型,能够将三维点云数据转化为结构化的三维场景理解输出,广泛应用于机器人导航、建筑设计等领域。
通过深度学习技术将图像转换为精确的 CAD 命令序列,从而实现从现实世界物体到数字孪生模型的快速转换。
多图像条件下的主体到图像生成模型,通过渐进式跨模态对齐和通用旋转位置嵌入,实现了高一致性和可控性的多主体生成。
端到端多模态SVG生成模型,能够通过文本、图像或角色参考等多种输入方式生成高质量的矢量图形。
通过混合引导实现精细的整体可控性、多尺度适应性和长期时间连贯性,能够生成高质量的人像动画。
千库网是一个提供丰富设计素材、模板设计以及海报图片下载的平台,适合设计师、广告从业者以及其他需要设计资源的用户。
能够通过自然语言指令生成动态的动漫游戏世界,并预测下一游戏状态,为用户带来沉浸式的动漫角色交互体验。
极具创新性的 AI 创作工具,通过分层创作、非破坏性编辑等强大功能,为用户提供前所未有的创意控制力,让 AI 艺术创作变得更加灵活和自由。
MoCha 是一款能够仅通过语音和文本生成电影级对话角色的合成工具,支持情感控制、动作控制以及多角色对话等功能。
日本动画电影制作公司,由导演宫崎骏、制片人铃木敏夫以及已故导演高畑勋于1985年共同创立。它以高质量的手绘动画、深刻的故事情节和独特的艺术风格闻名于世,作品多次获得国际奖项。
TaoAvatar 能够从多视角图像序列中生成逼真的、拓扑结构一致的 3D 全身虚拟形象
从单张图像重建可动画化三维人体的技术,能够快速生成高保真度的三维人体模型,并在秒级时间内生成具有精细纹理和姿态的虚拟角色。
能够根据文本描述和图像输入生成最长 102 帧的视频,具备运动幅度可控和镜头运动可控等核心特点。
Stability AI 推出的一款 AI 模型,能够将二维图像转换为具有真实深度和透视感的沉浸式三维视频。
旨在通过长上下文调优实现场景级视频生成,弥补单次拍摄生成能力与现实叙事视频制作(如电影)之间的差距,为视频创作带来更连贯、更具叙事性的生成效果。
一款用于生成高分辨率纹理化 3D 资产的大型 3D 合成系统,能够高效地创建高质量的 3D 模型和纹理。
能够从单张图像生成高保真3D场景,通过捕捉物体间的交互关系和空间一致性,实现高效且高质量的3D场景生成。
连接自由职业者与雇主的在线平台,提供多样化服务,满足企业和个人的项目需求。
基于生成式高斯绘制技术的无边界三维城市生成工具,能够高效生成逼真的虚拟城市环境。
设计工具,能够帮助用户快速生成图形、视频和动画,满足多种设计需求,让创意轻松落地。
视频生成框架,通过跨模态对齐技术结合文本和图像提示,从参考图像中提取主体元素并生成与文本描述一致的视频内容。
一款文本转语音工具,能够将输入的文本快速转换为高质量、富有表现力的语音内容。
昆仑万维开源的中国首个面向AI短剧创作的视频生成模型,能够实现影视级人物微表情表演生成和高质量视频创作。
能够实现视频中人物的精准替换和动作表情的无缝迁移,为创意设计和影视制作提供强大的技术支持。
它允许用户通过多种控制信号精确控制生成视频中物体的位置和相机运动,带来前所未有的创作自由度。
香港大学与字节跳动联合开发的一款先进的视频生成模型,能够根据文本或图片生成高质量的视频内容。
一款创新的人工智能工具,旨在将二维图像转换为引人入胜的三维动画体验。
一款基于人工智能技术的2D转3D模型生成平台,能够快速将2D图像转换为高质量的3D模型,并支持动画制作,广泛应用于数字艺术、游戏开发和影视制作等领域。
一款基于人工智能的3D艺术外包平台,通过结合机器学习和专业3D团队的力量,能够快速生成高质量的3D模型,帮助游戏开发者和创意工作者大幅提升工作效率。
一款能够将 2D 图像或文本快速转化为高质量 3D 模型的人工智能工具,支持多种格式输出,适用于多种行业和创作场景。
OpenAI开发的最新一代人工智能语言模型,它在处理速度、多模态交互、对话管理等方面实现了显著提升,广泛应用于教育、创意写作、编程辅助等多个领域。
DeepMind开发的一种大规模基础世界模型,旨在通过模拟真实世界环境来训练智能体,使其能够更好地理解和适应复杂多变的现实场景。
款免费AI 3D模型生成工具,能够通过图像和文字生成高质量的3D模型,广泛应用于3D建模、游戏开发、影视制作等领域。
商汤科技推出的AI表演应用,专为创意内容创作者设计,具备强大的生成功能和活跃的创意社区。
编程助手工具,旨在通过智能技术帮助开发者提升编程效率、优化代码质量并解决开发过程中的各种问题。
支持中英文提示词的AI角色生成工具,能够根据用户输入的描述生成具有独特外观和风格的角色图像。
北京奇点星宇科技推出的一个国内领先的AI图像创作绘画平台和模型分享社区,提供在线Stable Diffusion图片生成功能和海量的模型素材库。
MangaNinja是一种基于参考图像的线稿上色方法,通过独特的设计确保精确的人物细节转录,实现细粒度的颜色匹配和交互控制。
Kinetix AI视频技术是一项能够通过结合真人表演视频和文本指令,精准控制数字角色动作的创新工具。
个提供丰富人体 3D 扫描模型资源的平台,为数字人赛道创业者等提供了宝贵的素材支持。
谷歌 DeepMind 与布朗大学合作开发的“力提示”技术,能够在无需 3D 模型和物理引擎的情况下,通过指定力的方向和强度,生成逼真的运动效果。