蚂蚁灵光是蚂蚁集团发布的业内首个全代码生成多模态内容的通用 AI 助手,可在移动端实现自然语言 30 秒生成可编辑、可交互、可分享的小应用,支持多模态信息输出。
DPAI Arena 是业内首个开放式、多语言、多框架和多工作流的基准测试平台,旨在衡量 AI 编码智能体在真实软件工程任务中的表现,提供公平可重复的评估方案。
千问 App 是阿里巴巴基于全球第一开源模型通义千问 Qwen 打造的官方 AI 助手,是体验最新最强 Qwen 大模型的第一入口,致力于成为用户工作、学习、生活中的专属助手,还计划打造为未来的 AI 生活入口。
NiuTrans.LMT 是东北大学开源的多语言翻译大模型,凭借双中心架构与三层语言覆盖设计,支持 60 种语言、234 个翻译方向,在低资源语言翻译领域实现重大突破,兼顾翻译效率与准确性,为跨文化交互提供高效开源解决方案。
GPT-5.1 是 OpenAI 最新发布的“更快、更准、更懂人”的个性化 AI 助理。
Kosong 是 Moonshot AI 开源的 Python 框架,用异步编排+插件化设计,让开发者 5 分钟拼出可切换任意大模型的智能体。
商汤开源的2B/8B多模态模型,在空间理解基准上超越GPT-5,为自动驾驶、机器人提供“看懂世界”的通用引擎。
阿里 Qwen3-Max-Thinking 是参数破万亿、在数学竞赛与真实交易双线封王的大模型推理引擎。
Dola 是豆包面向海外市场推出的 AI 智能聊天助手,一款支持多语言、多场景对话与创作的大模型智能体应用。
ERNIE-5.0-Preview-1022 是百度最新发布的文心大模型预览版,在 LMArena 文本榜全球并列第二、国内第一,以创意写作、长文本理解与指令遵循三大能力为核心卖点。
Magika 1.0 是谷歌推出的基于 AI 的高性能文件类型检测工具,全面采用 Rust 重构,支持 200+ 文件格式,具备极高的识别速度与准确性。
中文原生图像编辑新王,框选即改、中文字体精准渲染,性能碾压 GPT-Image-1 与 Gemini 2.0。
Kimi K2 Thinking 是月之暗面开源的万亿级 MoE 模型,可在 300 轮内自主思考并调用工具,把复杂编码、写作、研究任务一步搞定。
Google Gemini 3 Pro 预览版是谷歌在 Vertex AI 上放出的旗舰级多模态大模型,一次可读 100 万 token,号称“长文神器”。
AQ 蚂蚁AI健康助手:上线4个月月活破千万、国内首款月活千万级的行业专业级AI医疗健康应用。
Kimi Linear 是月之暗面推出的全新注意力架构,用 KDA 技术把 KV 缓存砍掉 75%、推理速度直接翻 6 倍,让长文本大模型“既省内存又飙车”。
SoulX-Podcast是Soul推出的超长时长、高保真多语言AI播客生成引擎,可一键产出90分钟无中断、媲美真人录音的播客节目。
MoGA 是一种基于“混合分组注意力(Mixture-of-Groups Attention)”机制的高效 Transformer 变体,通过将输入序列动态划分为若干可学习的子组并并行计算组内-组间注意力,显著降低长序列推理成本,同时保持甚至提升下游任务精度。
华为应用市场是华为终端官方应用商店,集应用/游戏下载、更新、安全检测、个性化推荐、开发者服务于一体的核心分发平台,为 HarmonyOS 生态提供全场景内容入口。
AIBase GEO排名查询工具是一款专为生成引擎优化(GEO)设计的AI搜索排名监测工具,可实时追踪品牌在多个主流AI平台中的曝光与推荐情况。
Veo 3.1 是谷歌最新发布的视频生成模型,在 8 秒到 60 秒的可控时长内一次性输出 1080P 画面与同步音轨,并支持插入删除对象、首尾帧过渡、角色一致性等电影级精细编辑。
LLaVA-OneVision-1.5-8B-Instruct 是 lmms-lab 开源的多模态大模型,可同时理解图像与文本,并通过自然语言指令完成视觉问答、描述、推理等任务。
PaddleOCR-VL 是百度 2025 年 10 月开源的全球最强文档解析模型,仅用 0.9B 参数即可在复杂版面、手写、表格、公式、图表等全场景实现 SOTA 级“看懂+读懂”。
Gemini 3.0 Pro,Google 2025 年底即将发布的下一代多模态大模型,支持“会思考、能规划、可行动”的自主智能体能力。
FaceCLIP 是字节跳动开源在 Hugging Face 的 CLIP-风格人脸表征模型,用图文对比学习让机器“看得懂”人脸与文本的对应关系。
Qwen3-VL 是阿里开源的超长上下文视觉语言模型,能看图、读视频、写代码、操作界面,把“看得懂”升级为“做得到”。
nanochat 是 Andrej Karpathy 用纯 C 语言训练与推理 GPT-2 的“玩具级”教学项目,可在笔记本电脑上一分钟内完成文本生成,帮助开发者彻底理解大模型原理。
Cherry Studio 是一款开源、可本地部署的“多模型 AI 超级工具箱”,用图形化方式把大语言模型、知识库、绘画、搜索等能力整合到一台电脑上。
LiblibAI 2.0 是中国最大的多模态模型社区推出的全新创作平台,集成图像、视频生成与模型训练于一体,支持免费算力与海量模型资源,旨在让创作者“零门槛”实现高质量AI创作。
LFM2-8B-A1B 是 Liquid AI 推出的 8.3B 参数混合专家模型,仅激活 1.5B 即可在手机端跑出 4B 级速度,专为边缘 AI 设计。
快手开源的 72B 参数代码大模型,以 74.6% 的 SWE-Bench Verified 准确率刷新开源纪录,让“国产 AI 编程助手”第一次站上全球第一梯队。
GPT-5 Pro通过可扩展并行推理与更长思维链,对高难度任务给出当前业界最优答案,同时把幻觉率再降一个量级。
LMArena 是一个无需注册即可免费体验全球顶尖AI图像模型、实时对比效果并参与社区投票的开放评测平台。
可灵2.5 Turbo 是一款集文本理解、动态生成与风格保持于一体的 AI 视频生成模型,以更低成本实现更出色的视频创作效果。
Claude Sonnet 4.5 是 Anthropic 最新发布的通用大语言模型,在编程、推理、长文本处理与智能体任务方面刷新行业标杆。
DeepSeek-V3.2-Exp 是 DeepSeek 推出的实验性大语言模型,采用稀疏注意力机制,在保持模型性能的同时大幅提升长文本处理效率并降低成本。
Qwen3-Omni 是首个原生端到端全模态大模型,可同时处理文本、图像、音频、视频,并以文本或语音实时响应,支持119种语言,性能在36项基准中拿下22项SOTA。
Ring-flash-2.0 是蚂蚁百灵团队开源的百亿参数级高性能思考模型,专为低成本、高吞吐、长文本复杂推理任务设计。
苹果 Manzano 是首个在端侧实现“图像理解+图像生成”统一架构的多模态大模型,用一套参数同时完成“看懂图”和“画出图”。
Meta Code World Model(CWM)是 Meta FAIR 推出的 32B 参数世界模型,专为“理解代码如何运行”而设计,能预测程序行为、自动修复 bug,并支持超长上下文推理。
Qianfan-VL 是百度开源的多尺寸、多模态视觉理解大模型,集 OCR、文档解析、数学推理与图表分析于一身,可在国产昆仑芯上高效运行。
GO-1是智元机器人推出的全球首个开源通用具身智能基座大模型,基于ViLLA架构,让机器人“看得懂、想得通、做得准”。
DeepSeek-V3.1-Terminus 是 DeepSeek 于 2025 年推出的开源大语言模型,基于混合专家架构,支持思考与非思考双模式,具备强大的代码生成、搜索代理与多语言处理能力。
Qianfan-VL 是百度智能云千帆团队推出的多尺寸、多模态视觉理解大模型,专为企业级文档识别、图表解析、数学推理等高频场景深度优化。
SpikingBrain 是中国科学院推出的非 Transformer 类脑脉冲大模型,以极低数据与能耗实现超长序列任务百倍速推理。
IBM Granite-Docling-258M 是一款专为端到端文档转换设计的开源轻量级视觉语言模型,能高精度提取文档中的表格、公式、代码等内容并保留原始布局。
Qwen3-Omni 是阿里云开源的端到端全模态大模型,能同时听懂、看懂、说清 119 种语言,实时输出文本与自然语音。
上传一张图、一段参考视频,就能让角色“活”起来或把原片人物换成新角色,同时保持表情、动作、光影一致的开源 AI 视频神器。
CCI 3.0 是智源研究院发布的 1000 GB 级、经多维清洗与高质量标注的中文超大规模互联网语料库,为中文大模型与 NLP 研究提供“燃料”。
DeepMCPAgent是一个开源的MCP驱动代理框架,具备动态MCP工具发现机制和模型无关设计架构,主要应用于AI代理开发场景。
Grok4Fast 是基于 xAI 公司 Grok 4 大语言模型的开发工具,具备实时网络数据获取、多模态处理和高级推理能力,可助力开发者构建智能应用。
HuMo 是由可灵团队发布的一个多模态 HCVG(Human-Computer Visual Grounding)框架,支持多种灵活的多模态输入组合,包括“文本+图像”“文本+音频”以及“文本+图像+音频”。
MobiAgent 是上海交通大学 IPADS 实验室团队推出的一款移动端智能体工具链,支持用户从零构建专属 AI 助手,涵盖数据收集、模型训练到手机端部署的全流程。
该应用集成了Gemma系列模型,支持图像识别、音频对话和文字交互等多种功能,同时允许用户灵活切换模型以满足不同需求。
AgentGym-RL 框架:面向大模型智能体、在多样真实环境中“从零”进行多轮交互式强化学习的统一训练平台。
K2Think是一款由阿联酋穆罕默德·本·扎耶德人工智能大学(MBZUAI)和G42共同推出的低成本、高性能的AI推理模型。
腾讯混元图像2.1(HunyuanImage 2.1)是腾讯最新发布的开源文生图大模型,支持原生2K高清生图,具备强大的复杂语义理解能力。
EmbeddingGemma 是谷歌 DeepMind 推出的高效多语言嵌入模型,支持多种设备端部署,适用于多种自然语言处理任务。
Baseten 的平台专为推理而设计,能够提供现代 AI 应用所需的高性能、成本效益和可扩展性。通过将应用 AI 研究、灵活的基础设施和无缝的开发工具结合起来,Baseten 使处于 AI 前沿的公司能够将尖端模型投入生产。
rStar2-Agent是由微软研究院开源的一个140亿参数的数学推理模型,通过创新的训练算法和基础设施,实现了媲美6710亿参数模型的推理能力。
蚂蚁灵光是蚂蚁集团发布的业内首个全代码生成多模态内容的通用 AI 助手,可在移动端实现自然语言 30 秒生成可编辑、可交互、可分享的小应用,支持多模态信息输出。