专注于生成吉卜力风格的图像,用户可以通过简单的操作将普通图像转换为具有吉卜力动画特色的艺术作品。
全球首款专为狗狗设计的文本转语音(TTS)模型,通过模仿狗狗的叫声,为宠物主人提供与爱宠“对话”的全新体验。
前沿的文本转语音工具,凭借其强大的语音合成能力和丰富的应用场景,正在改变人们与声音交互的方式。
能够高效生成高分辨率的多视角视频,并支持对驾驶场景的细粒度控制。
基于 ComfyUI 框架开发的 AI 驱动的定制节点工具,旨在通过自然语言交互简化和增强 AI 算法调试与部署流程,为用户提供智能的节点推荐、工作流构建辅助和模型查询服务。
视频生成技术,通过高效的蒸馏方法和合成数据集,显著提升了视频扩散模型的生成速度,同时保持了高质量的视频输出。
香港科技大学与Multimodal Art Projection(多模态艺术投影)团队联合开发的开源AI音乐生成模型,能够将歌词转化为完整的歌曲,支持多种音乐风格和语言。
谷歌推出的一款具备卓越推理能力和代码能力的人工智能模型,能够处理复杂问题并生成高质量的文本、代码和多模态内容。
阿里通义千问团队推出的新一代视觉推理模型,能够“看懂”图片和视频内容,并结合信息进行分析、推理和解决问题。
用于信息图表生成的文章级视觉文本渲染工具,能够高效地将文本内容转化为具有视觉吸引力的信息图表。
阿里开源的Qwen系列旗舰级端到端多模态大模型,能够无缝处理文本、图像、音频和视频等多种输入形式,并通过实时流式响应同时生成文本与自然语音合成输出。
阿里巴巴开源的多模态大模型,参数规模为32B,具备强大的视觉和语言处理能力。
DeepSeek 团队发布的高性能开源大模型,具有强大的编程能力、数学推理能力以及高效的推理效率,广泛适用于多种应用场景。
高性能多模态 AI 模型,专为专业领域优化,具备强大的代码生成、多模态交互和深度推理能力。
新一代多模态 AI 模型,具备强大的文本、图像生成能力以及高效的交互性能,能够为内容创作、设计、开发等多个领域提供强大的技术支持。
从单张图像重建可动画化三维人体的技术,能够快速生成高保真度的三维人体模型,并在秒级时间内生成具有精细纹理和姿态的虚拟角色。
集高性能计算服务与 AI 服务于一体的综合性平台,旨在通过构建一体化的超算算力网络和服务体系,满足国家重大科技项目、重点工程以及经济社会发展的高性能计算需求。
通过投票机制让用户选择哪个 AI 模型生成的 Minecraft 建筑更好,从而为 AI 模型的性能提供直观的对比和评估。
一款创新的图像生成工具,能够根据用户的文字描述生成高质量的个性化图像,并且在更换场景和内容时精准保留用户的身份特征。
为开发者提供的交互式演示平台,用于体验 OpenAI API 中的新型文本到语音模型,助力开发者快速构建相关应用。
开源的 AI 推理服务软件,旨在以高效率、低成本加速并扩展 AI 工厂中的 AI 推理模型。
一款基于NVIDIA GB10 Grace Blackwell Superchip的高性能AI计算平台,专为开发、微调和部署大规模AI模型而设计,提供强大的计算能力和灵活的部署选项。
Stability AI 推出的一款 AI 模型,能够将二维图像转换为具有真实深度和透视感的沉浸式三维视频。
全球首个开源的工业界多模态推理模型,具备强大的视觉链式推理能力,能够高效处理复杂的视觉和文本任务。
由 Mistral AI 开发的高性能语言模型,具备卓越的文本处理能力、多模态理解能力以及扩展至 128k tokens 的上下文窗口,适用于多种生成式 AI 任务,广泛应用于企业级和消费级场景。
谷歌推出的新一代文本转语音工具,基于先进的LLM模型,能够生成逼真且富有情感的语音,广泛应用于多种场景,为用户提供高质量的语音合成解决方案。
一款用于生成高分辨率纹理化 3D 资产的大型 3D 合成系统,能够高效地创建高质量的 3D 模型和纹理。
一个基于 Cangjie 平台开发的工具,旨在通过集成大语言模型和其他智能技术,为应用程序开发提供强大的智能支持和创造力增强功能。
基于神经热场的无混叠任意尺度超分辨率方法,能够实现高质量的图像放大,同时避免常见的混叠问题。
一种新型的快速图像到图像翻译方法,通过在潜在空间中进行桥接匹配,实现高效且多用途的图像转换。
香港中文大学、腾讯ARC Lab、东京大学和澳门大学等机构联合推出的开源视频修复和编辑工具,能够通过文字指令实现对任意长度视频的高效修复和编辑。
能够从单张图像生成高保真3D场景,通过捕捉物体间的交互关系和空间一致性,实现高效且高质量的3D场景生成。
基于Gemini 2.0技术的先进机器人控制模型,旨在通过强大的视觉-语言-动作(VLA)能力,让机器人能够高效地完成复杂的现实世界任务。
阿里巴巴通义实验室推出的全能型视频生成与编辑框架,集多种功能于一体,能够高效完成复杂的视频创作和编辑任务。
高效生成高质量视频的开源项目,旨在通过开源原则,让视频生成技术更加普及化,为内容创作者提供简化复杂流程的平台。
NVIDIA GPU Cloud 提供高性能GPU算力资源和优化的AI开发工具,专注于深度学习和AI应用。
高性能的GPU算力资源和一站式AI开发平台,支持从模型训练到部署的全流程。
AI算力资源和一站式机器学习平台,支持从模型训练到部署的全流程开发。
平台提供高性能GPU资源和统一调度管理,支持企业快速开发和部署AI应用。
基于PaddlePaddle框架的GPU资源,支持深度学习模型训练和部署,适合AI开发者快速上手。
ModelArts提供高性能AI算力,支持大规模模型训练和推理,助力企业快速实现AI应用。
高性能GPU资源和一站式机器学习平台TI-ONE,支持从数据接入到模型部署的全流程开发。
阿里云是国内领先的云服务提供商,提供高性能GPU云服务器和多种AI开发工具,支持大规模模型训练和推理。
专注于生成式人工智能(GenAI)领域的计算基础设施平台,提供多种大模型的高效部署和推理服务,旨在通过技术创新降低大模型的使用成本,加速AI技术的普及。
Anthropic 开发的最新一代混合推理 AI 模型,以其卓越的推理能力和高效处理复杂任务而备受关注。
基于 CAMEL-AI 框架开发的前沿多智能体协作框架,致力于通过动态智能体交互实现高效、自然且稳健的任务自动化。
MetaGPT 团队开发,旨在让用户无需邀请码即可创建和使用 AI 智能体,快速实现各种创意和任务自动化。
一款具备自我进化能力的GUI代理工具,旨在通过智能体自主学习和进化机制,高效地操作智能手机应用。
开源的AI应用开发平台,旨在通过开放核心应用和技术资源,帮助开发者、企业和研究人员探索大模型在多种场景下的应用潜力。
一款高性能、低硬件要求的视频生成工具,旨在为普通GPU用户提供强大的视频生成能力。
基于生成式高斯绘制技术的无边界三维城市生成工具,能够高效生成逼真的虚拟城市环境。
MiniMax推出的全新文本到图像生成模型,旨在通过高效的图像生成能力和极低的使用成本,帮助用户快速将文本描述转化为高质量的图像。
先进的文本到图像生成模型,支持中文和英文输入,能够根据文本描述生成高质量的图像。
Meta推出的一种新型视频自监督学习模型,能够通过观看视频自主学习物理世界的视觉表示,无需外部标注数据。
高效地将PDF文件和其他文档转换为结构化的纯文本。
科大讯飞发布的深度推理大模型,具备强大的深度思考和推理能力,尤其在中文数学领域表现卓越,广泛应用于教育、医疗等多个场景。
可控高效零样本文本到语音(TTS)系统,基于XTTS和Tortoise开发,能够纠正中文发音并控制停顿,同时在音质和说话者相似度方面表现出色。
一个开源的Python库,旨在简化实时音频和视频AI应用的开发过程。
DeepSeek 开源的一款高性能通信库,专为混合专家模型(MoE)和专家并行(EP)设计,提供高吞吐量和低延迟的通信解决方案,显著提升大规模分布式训练和推理的效率。
Anthropic 开发的一款先进的人工智能模型,具备强大的自然语言处理、代码生成、视觉数据处理和计算机操作能力,广泛应用于多种复杂任务和场景。
专注于生成吉卜力风格的图像,用户可以通过简单的操作将普通图像转换为具有吉卜力动画特色的艺术作品。