DeepSeek V4是深度求索(DeepSeek)推出的新一代原生多模态大语言模型,作为国产AI在硬核工程领域的重大突破,该模型以“百万级上下文窗口+原生多模态融合+极致性价比”为核心亮点,在编程、长文本处理领域实现对国际同类模型的超越,深度适配国产芯片,兼顾企业级实用性与低成本部署需求,标志着国产AI模型在高性能、自主可控领域的核心竞争力提升。
谷歌Gemini 3.1 Pro是谷歌DeepMind推出的新一代旗舰级多模态大语言模型,核心推理性能较前代提升逾两倍,在多项权威基准测试中超越GPT-5.2,具备强大的复杂问题解决能力、多模态处理能力和长文本处理能力,是一款覆盖个人、开发者、企业多场景的高性能AI工具。
智谱 GLM-5 是智谱 AI 推出的新一代旗舰大语言模型,复用 DeepSeek-V3 的 DSA 稀疏注意力架构,参数量达 745B,强化多模态能力,性能大幅提升,推动公司市值短期暴涨 200%。
Ming-flash-omni 2.0 是蚂蚁集团开源的新一代全模态大模型,基于 Ling-2.0 MoE 架构打造,实现视觉语言理解、图像生成编辑、语音 / 音效 / 音乐统一生成三大能力全面升级,部分指标超越 Gemini 2.5 Pro,为多模态应用开发提供高效统一入口。
XMAX AI 是一款打造全球领先实时交互 AI 视频模型的工具,依托虚实融合技术,通过摄像头和手势操作实现虚拟与现实的实时互动,让用户将想象落地到现实中,打造沉浸式的交互体验。
Qwen3.5 是阿里巴巴即将推出的新一代开源基座大模型,采用全新混合注意力机制,大概率为原生视觉理解 VLM 模型,计划春节期间开源并推出多规格模型版本,目前已完成多个主流 AI 开发框架的适配开发。
Pony Alpha 是 OpenRouter 平台于 2026 年 2 月 6 日上线的匿名高性能 AI 大模型,主打免费使用,在编程、推理等领域表现突出,疑似为智谱 AI GLM-5 的测试版本。
Seedance 2.0 是一款由字节跳动推出的下一代AI视频生成平台,能够在数秒内将文本、图片、视频、音频等多种素材转化为电影级高质量视频,凭借直观的操作流程和强大的AI能力,彻底革新视频创作模式,降低专业视频制作门槛。
Vibe 2.0 是 Mistral AI 推出的升级款终端编程助手,由全新 Devstral2 模型驱动,具备多文件协同、子代理模式及操作增强等核心升级,为开发者提供沉浸式自然语言编程体验,助力提升复杂项目开发效率与操作便捷性。
Kimi Code 是月之暗面(Moonshot AI)推出的新一代 AI 编程助手,基于 Kimi K2.5 多模态大模型,支持终端运行与主流编辑器集成,可通过图片、视频输入辅助编程,实现从代码生成到调试测试的全流程开发支持。
Qwen3-Max-Thinking 是阿里发布的万亿参数旗舰推理模型,在复杂推理、事实知识与智能体能力上实现跨越式升级,19 项权威测试对标 GPT-5.2 等国际顶流,成为国产推理模型新标杆。
Kimi K2.5 是 Moonshot AI 推出的升级款 AI 模型,凭借视觉能力与工具调用功能的双重优化,大幅提升了模型的实用价值,向代理式智能更进一步。
呜哩是阿里低调推出的 AIGC 创意设计生产力平台,集成通义千问图像模型全家桶,为创作者提供高效多元的创意生成解决方案,已正式开启测试。
蚂蚁百灵 Ling Studio 是蚂蚁集团推出的官方大模型 Web 交互平台,为开发者和 AI 爱好者提供一站式的模型体验、调试与开发环境。
TeleChat3 是中国电信 TeleAI 开源的国产千亿参数 MoE 大模型,支持“思考模式”并在全国产算力上完成 15T tokens 训练,可对标国际顶尖水平。
Step-DeepResearch 是阶跃星辰推出的一款高性价比、端到端深度研究代理模型,专为开放式研究场景中的自主信息探索和专业报告生成设计,能通过动态循环的推理、行动与反思,高效完成复杂研究任务。
智谱 AI(北京智谱华章科技)围绕 “让机器像人一样思考” 的愿景,构建了以官方主站为核心、开放平台为技术输出载体的线上服务体系,同时通过明确的 MaaS(Model as a Service)理念,为个人用户、开发者及企业提供全场景 AI 服务。
1min.AI 把文本、图像、音视频等十几种主流生成式 AI 能力打包成“终身订阅”,一次性付费即可在浏览器内无限调用,彻底告别按月续费。
GPT Image 1.5 是 OpenAI 最新发布的图像生成与编辑模型,可在 ChatGPT 内一句话出图、改图,效果更精准、文字更清晰、安全合规更严格。
GPT-5.2 是 OpenAI 推出的 GPT-5 代旗舰模型系列,包含 Instant、Thinking、Pro 三个版本,以自适应推理为核心,聚焦专业知识工作场景,为不同需求用户提供高效、可靠的 AI 辅助服务。
灵光网页版 AI 助手是蚂蚁集团推出的零代码小应用生成平台,可在 30 秒内把一句需求变成可运行的小程序,并自动同步到多端。
火山引擎推出的新一代多语种语音识别引擎,在复杂场景下实现更高精度与更强推理能力。
可灵O1是可灵AI推出的全球首款统一多模态视频大模型,支持文字、图像、视频三种指令输入,实现一句话生成视频、图生视频、局部编辑及镜头延展等多任务处理。
FLUX.2 是 Black Forest Labs 发布的包含 pro、flex、dev 和 klein 四个版本的图像生成与编辑模型系列,具备多图参考、4MP 分辨率编辑等核心能力,为不同需求用户提供从商用 API 到开源本地运行的多样化图像相关服务。
ZAYA1 是 AMD 与 IBM 及 Zyphra 合作推出的全球首个全程基于 AMD 硬件训练的混合专家基础模型,预训练数据达 14 万亿 tokens,在数学和 STEM 推理领域表现出色,综合性能对标 Qwen3 系列。
Claude Opus4.5 是 Anthropic 推出的最新旗舰混合推理 AI 模型,在编码、推理和长期任务管理方面表现卓越,同时大幅提升了安全性、效率与资源使用灵活性,能显著提高多类场景的生产力。
谷歌 Gemini 3 是目前性能领先、支持百万 token 超长上下文与原生多模态的旗舰级生成式 AI 模型。
Skywork R1V4-Lite 是昆仑万维(Skywork AI)推出的轻量级多模态智能体,聚焦视觉 - 语言推理,具备图像理解、工具调用、多步推理与深度研究能力,无需复杂提示词即可通过图像输入自动完成任务。
ElevenLabs 是一款集成图像生成、视频生成、声音合成、音乐创作与音效设计的一站式 AI 内容生产平台,依托多模态模型矩阵,为用户提供高效、高质量的内容创作解决方案,适配商业与个人创作场景。
Grok 4.1 是埃隆・马斯克旗下 xAI 推出的升级版大语言模型,包含 Grok 4.1 和 Grok 4.1 Thinking 两款型号,以免费开放、低幻觉率、高情商交互和多模态能力为核心亮点,在多项权威基准测试中表现突出。
蚂蚁灵光是蚂蚁集团发布的业内首个全代码生成多模态内容的通用 AI 助手,可在移动端实现自然语言 30 秒生成可编辑、可交互、可分享的小应用,支持多模态信息输出。
千问 App 是阿里巴巴基于全球第一开源模型通义千问 Qwen 打造的官方 AI 助手,是体验最新最强 Qwen 大模型的第一入口,致力于成为用户工作、学习、生活中的专属助手,还计划打造为未来的 AI 生活入口。
GPT-5.1 是 OpenAI 最新发布的“更快、更准、更懂人”的个性化 AI 助理。
阿里 Qwen3-Max-Thinking 是参数破万亿、在数学竞赛与真实交易双线封王的大模型推理引擎。
Dola 是豆包面向海外市场推出的 AI 智能聊天助手,一款支持多语言、多场景对话与创作的大模型智能体应用。
ERNIE-5.0-Preview-1022 是百度最新发布的文心大模型预览版,在 LMArena 文本榜全球并列第二、国内第一,以创意写作、长文本理解与指令遵循三大能力为核心卖点。
Kimi K2 Thinking 是月之暗面开源的万亿级 MoE 模型,可在 300 轮内自主思考并调用工具,把复杂编码、写作、研究任务一步搞定。
Google Gemini 3 Pro 预览版是谷歌在 Vertex AI 上放出的旗舰级多模态大模型,一次可读 100 万 token,号称“长文神器”。
Veo 3.1 是谷歌最新发布的视频生成模型,在 8 秒到 60 秒的可控时长内一次性输出 1080P 画面与同步音轨,并支持插入删除对象、首尾帧过渡、角色一致性等电影级精细编辑。
Gemini 3.0 Pro,Google 2025 年底即将发布的下一代多模态大模型,支持“会思考、能规划、可行动”的自主智能体能力。
Qwen3-VL 是阿里开源的超长上下文视觉语言模型,能看图、读视频、写代码、操作界面,把“看得懂”升级为“做得到”。
Cherry Studio 是一款开源、可本地部署的“多模型 AI 超级工具箱”,用图形化方式把大语言模型、知识库、绘画、搜索等能力整合到一台电脑上。
LiblibAI 2.0 是中国最大的多模态模型社区推出的全新创作平台,集成图像、视频生成与模型训练于一体,支持免费算力与海量模型资源,旨在让创作者“零门槛”实现高质量AI创作。
LFM2-8B-A1B 是 Liquid AI 推出的 8.3B 参数混合专家模型,仅激活 1.5B 即可在手机端跑出 4B 级速度,专为边缘 AI 设计。
GPT-5 Pro通过可扩展并行推理与更长思维链,对高难度任务给出当前业界最优答案,同时把幻觉率再降一个量级。
LMArena 是一个无需注册即可免费体验全球顶尖AI图像模型、实时对比效果并参与社区投票的开放评测平台。
可灵2.5 Turbo 是一款集文本理解、动态生成与风格保持于一体的 AI 视频生成模型,以更低成本实现更出色的视频创作效果。
Claude Sonnet 4.5 是 Anthropic 最新发布的通用大语言模型,在编程、推理、长文本处理与智能体任务方面刷新行业标杆。
DeepSeek-V3.2-Exp 是 DeepSeek 推出的实验性大语言模型,采用稀疏注意力机制,在保持模型性能的同时大幅提升长文本处理效率并降低成本。
Qwen3-Omni 是首个原生端到端全模态大模型,可同时处理文本、图像、音频、视频,并以文本或语音实时响应,支持119种语言,性能在36项基准中拿下22项SOTA。
Ring-flash-2.0 是蚂蚁百灵团队开源的百亿参数级高性能思考模型,专为低成本、高吞吐、长文本复杂推理任务设计。
DeepSeek-V3.1-Terminus 是 DeepSeek 于 2025 年推出的开源大语言模型,基于混合专家架构,支持思考与非思考双模式,具备强大的代码生成、搜索代理与多语言处理能力。
Qianfan-VL 是百度智能云千帆团队推出的多尺寸、多模态视觉理解大模型,专为企业级文档识别、图表解析、数学推理等高频场景深度优化。
SpikingBrain 是中国科学院推出的非 Transformer 类脑脉冲大模型,以极低数据与能耗实现超长序列任务百倍速推理。
Qwen3-Omni 是阿里云开源的端到端全模态大模型,能同时听懂、看懂、说清 119 种语言,实时输出文本与自然语音。
Grok4Fast 是基于 xAI 公司 Grok 4 大语言模型的开发工具,具备实时网络数据获取、多模态处理和高级推理能力,可助力开发者构建智能应用。
HuMo 是由可灵团队发布的一个多模态 HCVG(Human-Computer Visual Grounding)框架,支持多种灵活的多模态输入组合,包括“文本+图像”“文本+音频”以及“文本+图像+音频”。
该应用集成了Gemma系列模型,支持图像识别、音频对话和文字交互等多种功能,同时允许用户灵活切换模型以满足不同需求。
K2Think是一款由阿联酋穆罕默德·本·扎耶德人工智能大学(MBZUAI)和G42共同推出的低成本、高性能的AI推理模型。
EmbeddingGemma 是谷歌 DeepMind 推出的高效多语言嵌入模型,支持多种设备端部署,适用于多种自然语言处理任务。
DeepSeek V4是深度求索(DeepSeek)推出的新一代原生多模态大语言模型,作为国产AI在硬核工程领域的重大突破,该模型以“百万级上下文窗口+原生多模态融合+极致性价比”为核心亮点,在编程、长文本处理领域实现对国际同类模型的超越,深度适配国产芯片,兼顾企业级实用性与低成本部署需求,标志着国产AI模型在高性能、自主可控领域的核心竞争力提升。