AI大模型 | 网址分类目录 | AI工具箱

AI大模型

Revisit-Anything 视觉位置识别技术

Revisit-Anything 可以帮助用户高效地管理和回顾各种内容。它能够对文本、图像、代码等多种类型的文件进行分类和标记，方便用户快速找到所需内容。同时，该工具还支持搜索功能，用户可以通过关键词快速定位到特定的文件或信息。

西湖星辰Westlake-Omni

Westlake-Omni是一个开源的中文情感语音交互大语言模型，采用离散表示实现语音与文本模态的统一处理，支持低延迟生成和高质量的中文情感语音交互。

Hugging Face Chat macOS

HuggingFace公司最新推出的HuggingChat原生macOS客户端为macOS用户带来了无缝且直观的高级AI对话体验，支持本地使用语言模型，并集成了Markdown、网页浏览、代码语法高亮等实用功能。用户可以通过简单的安装步骤快速启动应用，随时享受强大的AI聊天能力。

Deepgram 语音 AI

一个提供语音到文本、文本到语音以及语言理解 API 的语音 AI 平台。它被全球顶尖企业、对话式 AI 领导者和初创公司所信赖，适用于医疗转录到自主代理等多种场景。

由Kyutai实验室精心研发的全双工语音对话系统，它通过结合先进的文本语言模型、神经音频编解码器和多流音频语言模型，实现了更自然、更流畅的人机对话体验。

Video Game Bunny（VGB）

VideoGameBunny-V1是一个基于Hugging Face平台的预训练模型，专注于视频游戏内容的理解与生成，旨在为游戏开发者、内容创作者和AI研究者提供强大的工具。

智谱AI是一个基于GLM预训练框架的双语对话模型，它通过多阶段增强预训练方法优化了中文问答和对话能力，并结合量化技术，实现了在消费级显卡上的本地部署。

Qwen2-VL是一个基于自然语言处理（NLP）技术的语音到文本（Voice-to-Text）和文本到语音（Text-to-Speech, TTS）转换工具，旨在提供高质量的语音转换服务。

Google AI Studio：开启智能应用开发的新篇章

谷歌推出的强大的人工智能开发平台，它允许开发者快速集成 Google DeepMind 的最新 AI 模型，为各种应用程序提供强大的智能功能。

Magic Fixup

MagicFixup是由Adobe Research开发的一款创新工具，它通过学习和分析动态视频中的变化，来优化和提升静态照片的编辑效果，使编辑后的照片更加自然和逼真。

Pulse Inspect 音频真实性检测

Pulse Inspect是Pindrop®提供的一款音频真实性检测工具，它通过分析音频来判断其是否为合成或真实，帮助用户在分享信息前验证音频的真实性。

书生·浦语 InternLM2.5

书生·浦语是一个致力于大模型研究与开发工具链的开源组织，为AI开发者提供高效、易用的开源平台，加速大模型与算法技术的普及与应用。

EmoTalk3D 数字人框架

EmoTalk3D是一款集成情感识别与三维虚拟角色交互的创新性沟通工具，能够根据用户的语音或文本输入自动生成对应的情感表达，实现与虚拟角色的深度情感交流。

面壁智能 MiniCPM-V2.6

MiniCPM-V是由OpenBMB开发的一款面向端侧部署的多模态大型语言模型（MLLM），支持图像、视频和文本输入，提供高质量的文本输出。

1 … 9 10 11 12 13 … 15