AI大模型 | 网址分类目录 | AI工具箱

AI大模型

Grok 3.5：基于第一性原理的AI推理工具

埃隆·马斯克旗下的xAI公司开发的人工智能工具，能够从第一性原理出发进行推理，精准解答火箭发动机、电化学等复杂技术问题。

Paper2Code：机器学习论文代码生成利器

开源的自动化机器学习论文代码生成器，能够将机器学习领域的学术论文自动转化为高质量且可运行的代码库。

Qwen3：阿里巴巴新一代混合推理大模型

阿里巴巴推出的最新一代混合推理大模型，支持119种语言，具备强大的推理、编码和智能体能力，广泛应用于自然语言理解、复杂推理、代码生成等场景。

依图语音开放平台：全方位语音识别与内容安全解决方案

专注于语音识别与内容安全的AI开放平台，提供多种语音审核与识别服务，广泛应用于直播、视频、音频等场景，助力企业保障内容安全。

Step1X-Edit：开源图像编辑模型，开启智能创作新时代

Stepfun AI 团队推出的开源图像编辑模型，能够通过人工智能技术实现高效、智能的图像编辑与创作。

PixVerse MCP：AI视频生成的强大工具

能够通过支持该协议的应用程序（如 Claude 或 Cursor）访问 PixVerse 的最新视频生成模型，实现高质量的 AI 视频创作。

360纳米AI“MCP万能工具箱”：开启AI工具化新时代

集成了110余款工具的AI应用平台，能够通过简单的指令调用各类工具，快速完成复杂任务，广泛应用于办公协作、学术研究、生活服务、金融分析等场景。

Nari Labs开源文本转语音模型Dia：生成自然对话与非语言提示

开源文本转语音（TTS）模型，能够生成高度逼真的对话语音，并支持情感语调、非语言提示（如笑声、咳嗽）以及声音克隆功能。

Suna：Kortix-AI 推出的开源通用 AI 智能体平台

Kortix-AI 推出的一款开源通用 AI 智能体平台，旨在成为 Manus 的替代品，通过自然语言对话实现复杂任务的自动化处理。

MarkItDown：文件转换为Markdown的Python工具

用于将各种文件格式（如 PDF、Word、PPT 等）转换为 Markdown 格式，便于与大型语言模型（LLM）和其他文本分析工具集成。

Intel AI Playground：基于 Intel® Arc™ GPU 的 AI 创作工具

开源的 AI 创作工具，专为搭载 Intel® Arc™ GPU 的 PC 设计，支持图像生成、图像风格化和聊天机器人等功能。

昆仑万维开源SkyReels-V2：无限时长电影生成模型

昆仑万维SkyReels团队推出的一款无限时长电影生成模型，基于扩散强迫框架结合多模态大语言模型等技术，能够生成高质量、无限时长的视频内容。

InstantCharacter：快速生成角色描述的工具

腾讯混元团队正式开源了InstantCharacter框架，这一基于扩散变换器的角色个性化工具，具备高一致性和灵活性，能够从单张图像生成多样化的角色定制，适用于多种艺术风格。

阿里通义万相Wan2.1：开源视频生成模型

Wan2.1 是一个开源的大规模视频生成模型工具，致力于通过先进的技术架构和优化策略，提供高性能、低资源消耗的视频生成解决方案，支持多种生成任务和多语言文本生成。

Seed-Thinking-v1.5：强化学习驱动的卓越推理模型

字节跳动推出的先进推理模型，通过强化学习提升推理能力，在数学、编程和科学等多个领域表现出色。

Copilot Vision：智能视觉助手，开启全新交互体验

集成在 Microsoft Edge 浏览器中的 AI 助手，能够理解用户浏览网页的上下文，并通过语音与用户实时互动，提供浏览辅助。

deepin：美观易用的开源国产操作系统

基于 Linux 的开源国产操作系统，以其美观的设计、用户友好的界面和强大的功能而受到广泛欢迎，旨在为用户提供高效、安全且个性化的使用体验。

SpatialLM：让三维空间理解更智能

专注于三维空间理解的大语言模型，能够将三维点云数据转化为结构化的三维场景理解输出，广泛应用于机器人导航、建筑设计等领域。

ModelScope 魔搭社区 AIGC专区：一站式 AI 模型创作与应用平台

集创意生成、模型训练、资源分享于一体的 AI 平台，为用户提供从图片生成到视频创作等多种功能，助力个性化模型的快速实现。

Agent2Agent A2A：开启智能代理协作新时代

谷歌提出的一种开放协议，旨在实现不同框架和供应商构建的自主、不透明代理之间的有效通信与协作，同时支持代理与用户的互动，填补了当前代理互操作性的空白。

Web.lmarena.ai：人工智能安全验证工具

专注于网络安全验证的人工智能工具，主要用于验证用户连接的安全性，确保用户身份的真实性，防止恶意攻击。

GPT-4.1：开启智能应用新纪元

OpenAI最新发布的高性能语言模型，具备卓越的编码能力、指令遵循能力和长文本处理能力，广泛应用于多种复杂场景，为开发者和企业提供了强大的AI支持。

Pusa-VidGen：千步视频扩散模型

创新的视频扩散模型，通过帧级别的噪声控制和向量化时间步，实现了高效率的视频生成，支持多种任务，如文本到视频、图像到视频等。

字节UNO：多主体驱动的高一致性生成模型

多图像条件下的主体到图像生成模型，通过渐进式跨模态对齐和通用旋转位置嵌入，实现了高一致性和可控性的多主体生成。

OpenGVLab InternVL3 系列模型：多模态对话的前沿工具

专为多模态对话设计的先进 AI 模型，能够处理图像、视频和文本等多种输入形式，生成高质量的对话内容。

Skywork-OR1：强大的数学与代码推理模型系列

SkyworkAI开发的一系列强大的数学和代码推理模型，通过大规模基于规则的强化学习训练而成，适用于多种复杂的推理任务。

OminiControl Art：AI艺术创作的高效工具

基于OminiControl框架开发的AI艺术创作工具，它将OpenAI的GPT-4o艺术风格与FLUX.1模型相结合，能够高效生成高质量的艺术图像。

Multi-SWE-bench：首个多语言代码修复基准数据集

首个专门针对多语言代码修复的基准数据集，旨在为代码修复研究提供高质量的数据支持，推动多语言编程环境下的代码修复技术发展。

文心大模型4.5Turbo：开启智能应用新纪元

在自然语言处理领域展现出了卓越的性能和广泛的应用潜力，能够为用户提供高效、智能的语言交互体验。

阿里云百炼全周期MCP服务

阿里云提供的基于模型上下文协议（MCP）的集成服务，主要用于实现AI模型与外部系统（如数据库、云平台等）的无缝交互。

HiDream-I1：开源的高性能图像生成模型

开源的图像生成基础模型，拥有 170 亿参数，能够在短时间内生成高质量的图像，达到行业领先的图像生成水平。

GitHub MCP Server：GitHub 的官方模型上下文协议服务器

GitHub 的官方模型上下文协议（MCP）服务器，它提供了与 GitHub API 的无缝集成，能够实现高级自动化和交互功能，帮助开发者和工具更高效地与 GitHub 生态系统进行交互。

DreamActor-M1：基于混合引导的人像动画生成工具

通过混合引导实现精细的整体可控性、多尺度适应性和长期时间连贯性，能够生成高质量的人像动画。

AnimeGamer：开启无限动漫生活模拟的AI工具

能够通过自然语言指令生成动态的动漫游戏世界，并预测下一游戏状态，为用户带来沉浸式的动漫角色交互体验。

微软WHAMM模型：实时生成可玩游戏的人工智能模型

创新的人工智能模型，能够完全在AI模型内部生成并运行经典游戏，实时呈现可供玩家操作的游戏版本。

GenSpark Super Agent：新一代自动化AI代理

GenSpark 推出的自动化 AI 代理工具，能够自主规划、执行多种复杂任务，涵盖数据分析、内容创作、通信交互等多个领域。

字节MegaTTS3：轻量化语音合成模型

MegaTTS3 是由字节跳动与浙江大学合作开发的一款轻量级文本转语音（TTS）模型，以高效、轻量化和高质量语音合成为特点。

MoCha：电影级对话角色合成工具

MoCha 是一款能够仅通过语音和文本生成电影级对话角色的合成工具，支持情感控制、动作控制以及多角色对话等功能。

1 … 5 6 7 8 9 … 15