一家专注于开发先进人工智能技术的公司,其核心产品包括 Claude 系列模型和相关工具,旨在通过强大的自然语言处理和推理能力,为企业和个人提供高效、智能的解决方案。
一款由国投智能全资子公司美亚柏科研发的AI内容检测工具,能够快速识别AI合成的图像、视频和文本等虚假信息,帮助用户辨别信息的真实性。
一款由阶跃星辰团队开发的开源文本到视频生成模型,拥有 300 亿参数,能够根据文本提示生成长达 204 帧的高质量视频,支持中英双语输入,并通过深度压缩技术和直接偏好优化提升生成效果。
生成式AI平台,提供从模型训练、微调到推理的全生命周期支持,支持多种开源模型和灵活的部署选项。
面向中小团队的 AI 聊天工具,支持多种主流 AI 模型,旨在为团队提供高效、智能的协作体验。
视频生成框架,通过跨模态对齐技术结合文本和图像提示,从参考图像中提取主体元素并生成与文本描述一致的视频内容。
微软推出的一款多模态AI代理基础模型,能够理解和执行多模态输入任务,涵盖从UI导航到机器人操作等多种复杂场景。
北京大学、Hedra Inc.和Nvidia联合推出的一款高效视频生成模型,能够在短时间内生成高质量的视频片段。
一款强大的开源语音交互模型,能够实现语音识别、对话生成、情感克隆和多语言支持,为用户提供高质量的实时语音交互体验。
昆仑万维开源的中国首个面向AI短剧创作的视频生成模型,能够实现影视级人物微表情表演生成和高质量视频创作。
图像到视频生成模型,能够从单张照片生成1K分辨率的多视角高清人像视频。
一款无需训练即可实现视频重光照的工具,通过渐进光融合技术,能够快速生成高质量且光照一致的视频。
一家专注于开发高效能AI芯片和软件解决方案的公司
该模型通过优化内存使用和减少推理延迟,极大提升了视频生成的效率。
能够实现视频中人物的精准替换和动作表情的无缝迁移,为创意设计和影视制作提供强大的技术支持。
它允许用户通过多种控制信号精确控制生成视频中物体的位置和相机运动,带来前所未有的创作自由度。
谷歌旗下的一家专注于人工智能研究的公司,致力于开发先进的机器学习算法和模型,推动人工智能技术的发展。
一款基于PyTorch的音乐生成工具包,支持高音质音乐、歌曲和音频生成,能够通过文本提示、音乐风格和结构等进行可控生成。
一款高保真多语言文本到语音(TTS)模型,支持实时语音克隆和多语言情感控制,能够生成自然、富有表现力的语音。
OpenAI开发的最新一代人工智能语言模型,它在处理速度、多模态交互、对话管理等方面实现了显著提升,广泛应用于教育、创意写作、编程辅助等多个领域。
Meta AI 推出的一款非侵入性脑机接口(BCI)模型,能够通过脑电图(EEG)或脑磁图(MEG)信号解码打字内容。
一款自回归视频生成模型,能够通过未标注的视频数据学习知识,并在围棋和机器人控制等任务中表现出色。
一款深度学习模型,专门用于从图像和视频中快速移除背景并提取前景。
一款智能办公助手,旨在通过人工智能技术帮助企业实现高效办公和数字化转型。
DeepMind开发的一种大规模基础世界模型,旨在通过模拟真实世界环境来训练智能体,使其能够更好地理解和适应复杂多变的现实场景。
一款开源的多模态AI模型,专注于图像生成与多模态理解任务,性能超越DALL-E 3和Stable Diffusion,适用于创意设计、教育、企业隐私保护等多种场景。
DeepSeek推出的第一代推理模型,性能与OpenAI的o1正式版相当,且开源了模型权重与训练框架。
强大的人工智能工具,能够通过多轮对话进行复杂的推理和问题解答,广泛应用于各种需要智能交互的场景。
专注于人工智能和机器学习的在线平台,提供多种登录方式,包括手机号码、微信和邮箱登录,支持用户在不同地区使用。
微软开发的开源框架,旨在设计、开发和评估自主AIOps智能代理,并构建可复现、标准化、互操作性强且可扩展的基准测试环境。
国内首个输出分步式讲解的推理模型,专为教育场景设计,能够通过思维链技术模拟人类思考过程,帮助学生更好地理解和掌握知识。
字节跳动推出的最新人工智能模型,具备强大的多模态能力、高效的推理性能和独立的数据生产体系,综合能力在多个评测基准上领先。
支持中英文提示词的AI角色生成工具,能够根据用户输入的描述生成具有独特外观和风格的角色图像。
商汤科技最新推出的第五代大模型,具备强大的语言、创造力、科学计算和多模态交互能力,并通过“云到边缘”的全栈式架构,广泛应用于金融、教育、交通等多个领域。
Epoch AI 是一个专注于人工智能和机器学习趋势研究的独立机构,通过严谨的分析和数据驱动的方法,为政策制定者、研究人员和行业从业者提供关于 AI 发展轨迹和社会影响的深度洞察。
华为云Stack的自动安装部署工具,可实现软件自动化部署、云服务扩容和业务调测。
一款基于人工智能技术的图像生成 API,可将用户的文字描述转化为逼真的图像作品。
Grok AI是由xAI公司推出的一款具有先进推理能力的网页版AI工具,支持推理、编程、视觉生成和创意创作等功能。
个提供丰富人体 3D 扫描模型资源的平台,为数字人赛道创业者等提供了宝贵的素材支持。
国内首个具备端到端语音同传能力的大模型,其同传速度与精度直逼人类专家。
Gemini AI AnyChat是一个实验性平台,展示了 Gemini AI 在视觉处理领域的突破,能够同时处理实时视频和静态图像。
科大讯飞推出的人工智能大模型,全面升级了文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力以及多模态能力,特别在数学和代码能力方面超越了GPT-4o。
Kokoro是一款新发布的语音合成模型,具有8200万参数,以其轻量级设计和高效性能在TTS领域表现卓越。
一款专为电商场景设计的多模态大型语言模型,旨在通过可扩展的视觉-语言架构提升各领域性能并拓展电商与短视频场景的应用边界。
全新开源模型,包括基础语言模型 MiniMax-Text-01 和视觉多模态模型 MiniMax-VL-01,旨在为开发者提供强大的 AI 能力。
全新多模态图片理解模型moonshot-v1-vision-preview,该模型在原有moonshot-v1系列的基础上进一步增强了多模态能力,旨在帮助Kimi更好地理解世界。该Vision模型具备卓越的图像识别能力,能够识别复杂细节并区分相似对象,表现出色,尤其在OCR文字识别和图像理解方面,超越传统软件的准确性。
具备强大的预测能力,可处理长达2048个时间点的单变量时间序列,支持任意预测时间跨度。
一个全球最大的人工智能与机器学习社区平台,汇集了超过2100万机器学习爱好者,旨在分享、压力测试和及时了解最新的机器学习技术和技巧。用户可以发现社区发布的海量模型、数据和代码,为下一个项目提供资源。
一个为企业提供安全、高效且可定制的 AI 工作空间,旨在帮助企业提升工作效率和数据安全性。
一款性能卓越、开源且成本效益高的大语言模型,具备强大的自然语言处理能力,广泛应用于语言生成、问答、对话系统等领域。
NVIDIA 推出的最新一代高性能计算架构,专为加速人工智能和高性能计算而设计。
英伟达推出的一款基础世界模型平台,旨在通过生成合成数据来加速物理AI系统的开发。
Grok是一款具备前沿聊天、编程和推理能力的人工智能工具,能够将文本概念转化为视觉现实,并在日常任务中提供实时洞察和辅助.
一种基于音频条件的潜在扩散模型的端到端唇同步框架,能够直接建模复杂的音视频关联.
一款具备强大中文逻辑推理能力的AI模型,能够处理复杂的数学、代码和逻辑推理任务。
YouMind是一个AI驱动的创作系统,旨在帮助用户将各种材料转化为灵感之作。
HuggingFace发布的轻量级开源代码库,旨在简化AI代理系统的开发过程,支持快速搭建Agent。
TANGOFLUX是一个高效的文本到音频(TTA)生成模型,拥有515M参数,能够在单个A40 GPU上仅用3.7秒生成长达30秒的44.1kHz音频。
VMix 是一个用于提升文本到图像扩散模型美学质量的插件式美学适配器。它通过在图像生成过程中引入美学控制,增强了生成图像的美学表现,同时保持了图像与文本的对齐。
一个用于图像超分辨率的开源工具,它通过先进的算法来增强图像的分辨率,使低分辨率图像变得更加清晰。
一家专注于开发先进人工智能技术的公司,其核心产品包括 Claude 系列模型和相关工具,旨在通过强大的自然语言处理和推理能力,为企业和个人提供高效、智能的解决方案。