趣丸科技与香港中文大学(深圳)联合研发的开源文本转语音(TTS)模型,能够实现零样本语音合成,无需显式对齐信息和音素级时长预测,支持多种语言和情感控制。
阿里通义实验室开源的全新预训练框架,能够让AI学会“主动搜索+多步推理”,从而更准确、更智能地回答复杂问题。
Mistral 推出的首个推理模型系列,旨在通过分步骤解决问题,提升在数学、物理等学科领域的一致性和可靠性。
OpenAI o3-pro 是一款强大的推理模型,专为解决复杂问题而设计,尤其在科学、教育、编程等需要深度思考的领域表现出色。
豆包大模型1.6是由字节跳动旗下火山引擎发布的一款强大的AI模型,具备深度思考、多模态理解和图形界面操作等能力,能够为企业提供高效、低成本的AI解决方案。
阿里云推出的一系列高性能AI模型,涵盖多种参数规模和功能特点,广泛应用于文本生成、代码辅助、多语言交互等多个领域,为开发者和企业提供了强大的AI支持。
开源的轻量化文本转语音(TTS)模型,基于 S1 模型开发,参数规模为 5 亿,支持 14 种语言和 50+ 情感语气控制。
BAAI智源研究院是致力于人工智能前沿技术研究与创新的科研机构,推动人工智能技术的发展与应用,培养顶尖人才,促进学术交流与合作。
Anthropic 公司专为美国国家安全机构设计的人工智能模型,旨在满足政府在情报分析、战略规划和威胁评估等方面的需求。
字节跳动豆包大模型团队推出的一款通用图像编辑模型,用户仅需输入简单的自然语言指令,就能实现专业级的图像编辑效果。
阿里巴巴通义实验室开源的一款文本嵌入模型,能够将文本转换为高维向量,精准捕捉语义信息,广泛应用于文本检索、排序等场景。
一家全球领先的物联网平台,其提供的Tuya.AI工具,集成了AI和IoT的核心能力,是面向智能硬件领域的一站式AIoT快速解决方案。
基于 RESTful 架构的应用程序接口,允许开发者通过 HTTP 请求与 DeepSeek 的大型语言模型进行交互,为各种应用提供强大的人工智能支持。
基于深度学习技术的语义检索模型,能够精准地理解和匹配文本之间的语义相似度,为用户提供高效准确的检索结果。
集搜索、写作、对话、文档分析、图片生成、PPT制作等多功能于一体的全能型人工智能助手,能够为用户提供高效、便捷的智能服务。
轻量级的多功能办公工具,通过人工智能技术生成多种文件类型,包括文档、演示文稿、电子表格等,旨在提高办公效率和创造力。
分层多智能体系统,专为深度研究任务和通用任务解决而设计,通过顶层规划智能体协调多个专业底层智能体,实现任务的自动分解和高效执行。
全球领先的互联网平台公司,致力于通过技术创新推动人工智能、游戏、社交等多领域的融合发展。
谷歌DeepMind开发的AI编程智能体,通过结合大型语言模型的创造力和自动评估器,进化和优化通用算法,广泛应用于数学、计算机科学及硬件设计等领域。
字节跳动开源的一个多模态基础模型,拥有70亿活跃参数(总计140亿),在大规模交错多模态数据上进行训练,其在多模态理解排行榜上超越了当前顶级开源视觉语言模型,如Qwen2.5-VL和InternVL-2.5,并且在文本到图像生成质量上与强大的专业生成器如SD3相当。
谷歌开发的一款开源AI模型,专为医疗图像与文本分析设计,旨在提升医疗诊断和治疗的效率与准确性。
新型的多模态大语言模型(MLLM),专为时间序列分析而设计,通过合成数据训练,能够显著提升对时间序列的理解和推理能力。
开源的多模态大型扩散语言模型,旨在通过统一的扩散架构和先进的训练策略,在文本生成、多模态理解和图像生成等领域实现卓越性能。
谷歌推出的一款用于检测AI生成内容的工具,能够通过识别嵌入在多媒体文件中的隐形数字水印,判断内容是否由AI生成。
xAI Live Search 是一款集成在 xAI 平台上的实时搜索功能,能够为用户提供基于最新数据的智能对话服务。
MCP 服务器是一个为 AI 客户端提供上下文、工具和提示的系统,通过标准化协议安全地连接各种数据源。
百度开源的基于 PaddlePaddle 框架的多语言 OCR(光学字符识别)工具,它支持 80 多种语言的识别,提供数据标注和合成工具,并支持在服务器、移动设备、嵌入式设备和物联网设备上的训练和部署。
一款专为数学建模竞赛设计的自动化智能体系统,能够将原本需要 3 天的建模过程压缩至 1 小时,直接输出符合学术规范的完整论文。
以色列科技公司Lightricks发布的开源AI视频生成模型,能够在短时间内生成高质量的视频内容。
Wan2.1 是一个开源的、先进的大规模视频生成模型套件,能够在多种视频生成任务中提供卓越的性能和效果。
基于扩散模型的情感化动态头像生成方法,能够为说话的肖像生成生动且多样化的情感表达。
一个免费的在线课程,旨在帮助初学者深入了解、使用并构建基于 MCP 的 AI 应用程序。
一款为企业和开发者提供的高质量、可定制且安全的机器翻译API,能够帮助用户构建多语言的产品和应用。
Flow-GRPO 是一种通过在线强化学习训练流匹配模型的工具,能够显著提升图像生成质量和模型性能。
清华大学自然语言处理实验室(THUNLP)和ModelBest联合开发的开源设备端GUI代理工具,能够操作中文和英文安卓应用,并通过强化微调提升推理能力,高效执行任务。
字节跳动推出的视觉语言基础模型,旨在推进通用多模态理解和推理能力,并在多个公共基准测试中取得了优异的成绩。
图像定制的统一框架,能够实现多种图像生成任务,如人物定制、风格转换、虚拟试穿等。
用于可控游戏世界生成的互动世界基础模型,能够基于参考图像、运动帧和用户操作生成高质量的互动视频。
快手平台提供并完全人工标注的首个针对 SVP 生态治理的基准工具,旨在为相关研究和应用提供标准化的数据支持。
旨在为用户提供高效、低代码的工程孪生场景构建与渲染解决方案。
创新的强化学习框架,通过利用大型语言模型(LLM)模拟搜索引擎,从而无需依赖真实的搜索引擎即可实现高效的搜索与优化。
腾讯 PCG 的人工智能与机器学习实验室,专注于计算机视觉、语音和自然语言处理等领域,致力于在语音/视频生成、增强、检索、理解以及 AutoML 等技术上进行探索、创新和突破。
能够让您在无需安装 Microsoft Excel 的情况下,通过 AI 代理对 Excel 文件进行创建、读取、修改、格式化、生成图表和透视表等操作。
理解和评估视频中相机运动的基准工具,旨在通过结合几何和语义信息,提升对视频中相机运动的理解和分析能力。
小米开源的首个推理大模型,旨在提升模型在复杂推理任务中的表现,尤其在数学推理和代码生成方面表现出色。
埃隆·马斯克旗下的xAI公司开发的人工智能工具,能够从第一性原理出发进行推理,精准解答火箭发动机、电化学等复杂技术问题。
开源视觉语言模型,具备原生分辨率图像理解、多模态推理和128K长上下文处理能力。
基于 Android 的定制操作系统,专为魅族手机设计,提供丰富的功能和优化的用户体验。
开源的自动化机器学习论文代码生成器,能够将机器学习领域的学术论文自动转化为高质量且可运行的代码库。
阿里巴巴推出的最新一代混合推理大模型,支持119种语言,具备强大的推理、编码和智能体能力,广泛应用于自然语言理解、复杂推理、代码生成等场景。
专注于语音识别与内容安全的AI开放平台,提供多种语音审核与识别服务,广泛应用于直播、视频、音频等场景,助力企业保障内容安全。
通用大模型,具备高智商、高情商和多模态融合的特点,广泛应用于多个领域。
基于多模态大语言模型(MLLLM)的统一图像编辑工具,能够根据真实的用户指令完成高质量的图像编辑任务。
Stepfun AI 团队推出的开源图像编辑模型,能够通过人工智能技术实现高效、智能的图像编辑与创作。
开源的音频基础模型,擅长音频理解、生成和对话,适用于多种音频处理任务。
能够通过支持该协议的应用程序(如 Claude 或 Cursor)访问 PixVerse 的最新视频生成模型,实现高质量的 AI 视频创作。
强大的AI工具,能够根据图像或视频中的指定区域生成详细的描述。
一个强大的人工智能接口,能够通过自然语言处理技术为用户提供文本生成、对话交互等多种功能。
基于先进人工智能技术的图像生成工具,能够根据用户输入的文本描述快速生成高质量的图像内容。
Pad.ws 是一款集白板与代码编辑器功能于一体的在线协作工具,旨在为开发者和团队提供便捷的实时协作体验。
趣丸科技与香港中文大学(深圳)联合研发的开源文本转语音(TTS)模型,能够实现零样本语音合成,无需显式对齐信息和音素级时长预测,支持多种语言和情感控制。