AI大模型 | 网址分类目录

渝小健智能体

重庆市便捷就医智能体，由重庆市卫健委联合蚂蚁集团打造，提供AI导诊、云陪诊、报告解读全流程就医服务，接入233家医疗机构，需通过支付宝App或蚂蚁阿福App搜索使用。

Kimi K3（月之暗面）

Kimi K3 是月之暗面于2026年7月发布的新一代开源大语言模型，参数规模达2.8万亿，支持100万Token超长上下文，在代码、数学、推理与长文本理解上全面跃升，原生支持Agent工作流，面向开发者与企业开放。

GPT-5.6（OpenAI）

OpenAI 2026年7月8日发布的最新旗舰模型系列，包含GPT-5.6 Pro、GPT-5.6 Mini和ChatGPT Work企业级Agent，全面超越Claude 4 Opus，在科学推理、数学和Agent协作能力上领先。

豆包音频生成模型1.0 (Seed-Audio 1.0)

字节跳动火山引擎发布的端到端音频生成大模型，支持在一次生成中同步编排角色对白、情绪语气、背景音乐及拟音特效，一次性直出影视级成品音效。

千问高考志愿Agent

阿里巴巴千问团队推出的国内首个全周期高考志愿填报智能体，基于千问高考志愿大模型深度整合夸克8年高考数据，免费为全国考生提供个性化志愿填报服务。

Claude Fable 5

Anthropic 于2026年6月发布的旗舰级大语言模型，属于Mythos系列首次面向公众开放的版本，在软件工程、视觉处理、科学研究等领域表现卓越。

Gemini Omni

Gemini Omni是譽歧DeepMind推出的全模态AI视频生成模型，属于Gemini系列最新成员。支持文本、图像、视频的跨模态理解与生成，2026年5月测漏后引发科技圈广泛讨论，善于生成包含数学公式、物理现象等高一致性内容。

Grok 3 Plus

Grok 3 Plus是xAI推出的AI视频生成工具，支持文本生成视频和图片生成视频两种模式。最长可生成30秒视频，支持真人照片上传，生成速度快，约5分钟完成一条视频。价格亲民，每条视频仅需0.3元，是目前性价比最高的AI视频生成工具之一。

Kimi K2.6：月之暗面通用大模型，Agent集群与代码能力全面升级

月之暗面发布的最新一代通用大模型，支持Agent集群协同、12个AI专家并行调研、多Agent协作办公，40分钟完成专业企划、PPT及财务表。

通义Qwen3.6-Max-Preview：登顶最佳国产大模型，智能体编程能力再突破

通义Qwen3.6-Max-Preview是阿里巴巴于2026年4月20日发布的千问系列新一代旗舰大模型预览版[…]

Claude Opus 4.7

Anthropic旗舰AI模型最新迭代，编程能力超越GPT-5.4和Gemini 3.1 Pro，核心突破在于「更靠谱」而非「更聪明」，任务可靠性和答案准确性大幅提升。

Happy Oyster（快乐生蚝）：阿里开源世界模型发布三维互动视频生成

阿里ATH发布的世界模型产品，支持三维互动视频生成，可用于影视制作和游戏开发，目前处于限量早期体验阶段。

混元3D世界模型2.0（HY-World 2.0）

腾讯混元3D世界模型2.0开源！支持文字/图片/视频多模态生成可编辑3D世界，导出Mesh/3DGS/点云，无缝衔接Unity/UE游戏引擎。

Kimi K2.6-code-preview：月之暗面AI编程大模型

Kimi K2.6-code-preview是月之暗面于2026年4月推出的万亿参数AI编程大模型，专为编程场景优化，需Kimi Code Plan订阅使用，月费39元起。

Seeduplex（字节Seed语音大模型）

Seeduplex是字节跳动于2026年4月9日发布的全双工语音大模型。采用"边听边说"架构，突破传统半双工交互模式，实现听与说同步处理。已在豆包App全量上线，成为业内首个规模化部署的全双工语音大模型。

Remotion

Remotion是一个开源的React视频框架，可以通过编程方式创建视频动画。使用React和TypeScript编写视频，通过浏览器按时间线查看和渲染。支持动画效果、转场特效、动态文本、复杂场景等。个人免费使用。

Hermes Agent

Nous Research开源的可自我进化的AI Agent框架。内置闭环学习循环，能从成功经验中自动生成可复用skill，跨会话持久记忆用户偏好。MIT开源，GitHub超4万Star，月成本仅5美元，支持私有化部署。

智谱GLM-5.1：能独立工作8小时的AI编程大模型

智谱最新开源编程大模型，能在8小时内独立完成复杂工程项目，SWE-Bench评分全球领跑，支持自我评估与优化。

美团 LongCat-AudioDiT：开源音频大模型，首创波形潜空间建模

美团开源音频生成大模型，首创波形潜空间建模，刷新音色克隆 SOTA，解决音色漂移问题。

Anthropic Conway：龙虾独立运行环境，支持始终在线和 Webhook 唤醒

Anthropic 为 Claude 打造的独立运行环境，支持始终在线、浏览器操作、外部连接器连接。

智谱 GLM-5V-Turbo：多模态 Coding 大模型，视觉与编程能力深度融合

智谱多模态 Coding 大模型，支持前端复刻、GUI 自主探索和交互式编辑，视觉与编程能力深度融合。

Anthropic Conway：龙虾独立运行环境，支持始终在线和 Webhook 唤醒

Anthropic 为 Claude 打造的独立运行环境，支持始终在线、浏览器操作、外部连接器连接。

美团 LongCat-AudioDiT：开源音频大模型，首创波形潜空间建模

美团开源音频生成大模型，首创波形潜空间建模，刷新音色克隆 SOTA，解决音色漂移问题。

智谱 GLM-5V-Turbo：多模态 Coding 大模型，视觉与编程能力深度融合

智谱多模态 Coding 大模型，支持前端复刻、GUI 自主探索和交互式编辑，视觉与编程能力深度融合。

Zread：AI 项目探索平台，智能发现和分析开源项目，帮助开发者快速找到匹配的技术方案

AI 项目探索平台，智能发现和分析开源项目，帮助开发者快速找到匹配的技术方案

PixVerse V6 是爱诗科技最新 AI 视频生成模型，在画质质量、物理模拟和动态表现上实现重大突破，支持生成电影级质感的视频内容。

Claude Code Auto Mode：Anthropic 推出自动驾驶模式，AI 编程告别每步确认

Claude Code Auto Mode 2026 年 3 月 25 日发布，智能安全分类器 + 自动执行，AI 编程进入自动驾驶时代。

众智社区：面向多种 AI 芯片的全栈开源技术社区，FlagOS 统一软件栈发起方

众智社区联合十多家国内外机构发起创立，推出面向多种 AI 芯片的开源统一软件栈 FlagOS，打破芯片生态隔离，降低开发者迁移成本。

ClawHub - OpenClaw 官方技能商店，海量优质技能一键安装

OpenClaw 官方技能商店，汇聚海量优质技能，支持一键安装、版本管理、向量搜索，是用户获取安全可信扩展能力的核心阵地。

Gemini 3.1 Flash Live - 谷歌实时语音多模态模型，Search Live 全球上线

谷歌实时语音多模态模型，Search Live 全球上线，支持摄像头实时识别与低延迟语音对话，开发者可构建实时智能代理应用。

DeerFlow 2.0 - 字节开源超级智能体编排框架，GitHub trending 榜首

字节开源超级智能体编排框架，GitHub trending 榜首，4 万 + Star，支持多模型、安全沙箱、IM 渠道接入，适合企业级复杂任务。