Pad.ws 是一款集白板与代码编辑器功能于一体的在线协作工具,旨在为开发者和团队提供便捷的实时协作体验。
集成了110余款工具的AI应用平台,能够通过简单的指令调用各类工具,快速完成复杂任务,广泛应用于办公协作、学术研究、生活服务、金融分析等场景。
开源文本转语音(TTS)模型,能够生成高度逼真的对话语音,并支持情感语调、非语言提示(如笑声、咳嗽)以及声音克隆功能。
Kortix-AI 推出的一款开源通用 AI 智能体平台,旨在成为 Manus 的替代品,通过自然语言对话实现复杂任务的自动化处理。
无需调优的全向全景图像和视频生成工具,通过球形潜在表示实现高质量的 360 度全景内容生成。
用于将各种文件格式(如 PDF、Word、PPT 等)转换为 Markdown 格式,便于与大型语言模型(LLM)和其他文本分析工具集成。
开源的 AI 创作工具,专为搭载 Intel® Arc™ GPU 的 PC 设计,支持图像生成、图像风格化和聊天机器人等功能。
昆仑万维SkyReels团队推出的一款无限时长电影生成模型,基于扩散强迫框架结合多模态大语言模型等技术,能够生成高质量、无限时长的视频内容。
腾讯混元团队正式开源了InstantCharacter框架,这一基于扩散变换器的角色个性化工具,具备高一致性和灵活性,能够从单张图像生成多样化的角色定制,适用于多种艺术风格。
Wan2.1 是一个开源的大规模视频生成模型工具,致力于通过先进的技术架构和优化策略,提供高性能、低资源消耗的视频生成解决方案,支持多种生成任务和多语言文本生成。
字节跳动推出的先进推理模型,通过强化学习提升推理能力,在数学、编程和科学等多个领域表现出色。
集成在 Microsoft Edge 浏览器中的 AI 助手,能够理解用户浏览网页的上下文,并通过语音与用户实时互动,提供浏览辅助。
基于 Linux 的开源国产操作系统,以其美观的设计、用户友好的界面和强大的功能而受到广泛欢迎,旨在为用户提供高效、安全且个性化的使用体验。
OpenAI o3 是一款强大的推理模型,能够在多领域提供深度分析和复杂问题的解决方案。
一款高效、低成本的推理模型,专为快速推理和高吞吐量任务设计。
专注于三维空间理解的大语言模型,能够将三维点云数据转化为结构化的三维场景理解输出,广泛应用于机器人导航、建筑设计等领域。
用于帮助用户更好地构建和优化提示,以充分发挥 GPT-4 模型的能力。
集创意生成、模型训练、资源分享于一体的 AI 平台,为用户提供从图片生成到视频创作等多种功能,助力个性化模型的快速实现。
中国首个最大的MCP中文社区,为AI开发者提供了丰富的MCP服务和调试工具,推动了AI应用的创新和落地。
谷歌提出的一种开放协议,旨在实现不同框架和供应商构建的自主、不透明代理之间的有效通信与协作,同时支持代理与用户的互动,填补了当前代理互操作性的空白。
智谱AI启用全新域名 Z.ai,并开源 32B/9B 系列 GLM 模型,为用户提供强大的 AI 模型体验和开发支持。
专注于网络安全验证的人工智能工具,主要用于验证用户连接的安全性,确保用户身份的真实性,防止恶意攻击。
OpenAI最新发布的高性能语言模型,具备卓越的编码能力、指令遵循能力和长文本处理能力,广泛应用于多种复杂场景,为开发者和企业提供了强大的AI支持。
创新的视频扩散模型,通过帧级别的噪声控制和向量化时间步,实现了高效率的视频生成,支持多种任务,如文本到视频、图像到视频等。
多图像条件下的主体到图像生成模型,通过渐进式跨模态对齐和通用旋转位置嵌入,实现了高一致性和可控性的多主体生成。
专为多模态对话设计的先进 AI 模型,能够处理图像、视频和文本等多种输入形式,生成高质量的对话内容。
SkyworkAI开发的一系列强大的数学和代码推理模型,通过大规模基于规则的强化学习训练而成,适用于多种复杂的推理任务。
全面支持MCP(Model Context Protocol),能够帮助开发者快速构建和部署智能语音交互应用 。
基于OminiControl框架开发的AI艺术创作工具,它将OpenAI的GPT-4o艺术风格与FLUX.1模型相结合,能够高效生成高质量的艺术图像。
端到端多模态SVG生成模型,能够通过文本、图像或角色参考等多种输入方式生成高质量的矢量图形。
首个专门针对多语言代码修复的基准数据集,旨在为代码修复研究提供高质量的数据支持,推动多语言编程环境下的代码修复技术发展。
在自然语言处理领域展现出了卓越的性能和广泛的应用潜力,能够为用户提供高效、智能的语言交互体验。
阿里云提供的基于模型上下文协议(MCP)的集成服务,主要用于实现AI模型与外部系统(如数据库、云平台等)的无缝交互。
精选的 MCP(模型上下文协议)服务器列表,涵盖了多种语言、数据库、云平台和工具的集成。
专注于 MCP(模型上下文协议)的资源网站,提供丰富的学习资料、开发工具和社区支持,帮助开发者更好地掌握和应用 MCP 技术。
用于管理和集成各种大型语言模型(LLM)服务的 MCP(模型上下文协议)服务器集合。
开源的图像生成基础模型,拥有 170 亿参数,能够在短时间内生成高质量的图像,达到行业领先的图像生成水平。
GitHub 的官方模型上下文协议(MCP)服务器,它提供了与 GitHub API 的无缝集成,能够实现高级自动化和交互功能,帮助开发者和工具更高效地与 GitHub 生态系统进行交互。
通过混合引导实现精细的整体可控性、多尺度适应性和长期时间连贯性,能够生成高质量的人像动画。
能够通过自然语言指令生成动态的动漫游戏世界,并预测下一游戏状态,为用户带来沉浸式的动漫角色交互体验。
创新的人工智能模型,能够完全在AI模型内部生成并运行经典游戏,实时呈现可供玩家操作的游戏版本。
高性能多模态 AI 模型,具备超长上下文处理能力和高效的推理性能,适用于多种复杂任务。
GenSpark 推出的自动化 AI 代理工具,能够自主规划、执行多种复杂任务,涵盖数据分析、内容创作、通信交互等多个领域。
MegaTTS3 是由字节跳动与浙江大学合作开发的一款轻量级文本转语音(TTS)模型,以高效、轻量化和高质量语音合成为特点。
MoCha 是一款能够仅通过语音和文本生成电影级对话角色的合成工具,支持情感控制、动作控制以及多角色对话等功能。
百度飞桨3.0是百度推出的深度学习框架的最新版本,以五大核心技术创新为大模型训推提速。
专注于生成吉卜力风格的图像,用户可以通过简单的操作将普通图像转换为具有吉卜力动画特色的艺术作品。
全球首款专为狗狗设计的文本转语音(TTS)模型,通过模仿狗狗的叫声,为宠物主人提供与爱宠“对话”的全新体验。
前沿的文本转语音工具,凭借其强大的语音合成能力和丰富的应用场景,正在改变人们与声音交互的方式。
能够高效生成高分辨率的多视角视频,并支持对驾驶场景的细粒度控制。
基于 ComfyUI 框架开发的 AI 驱动的定制节点工具,旨在通过自然语言交互简化和增强 AI 算法调试与部署流程,为用户提供智能的节点推荐、工作流构建辅助和模型查询服务。
视频生成技术,通过高效的蒸馏方法和合成数据集,显著提升了视频扩散模型的生成速度,同时保持了高质量的视频输出。
香港科技大学与Multimodal Art Projection(多模态艺术投影)团队联合开发的开源AI音乐生成模型,能够将歌词转化为完整的歌曲,支持多种音乐风格和语言。
谷歌推出的一款具备卓越推理能力和代码能力的人工智能模型,能够处理复杂问题并生成高质量的文本、代码和多模态内容。
阿里通义千问团队推出的新一代视觉推理模型,能够“看懂”图片和视频内容,并结合信息进行分析、推理和解决问题。
用于信息图表生成的文章级视觉文本渲染工具,能够高效地将文本内容转化为具有视觉吸引力的信息图表。
阿里开源的Qwen系列旗舰级端到端多模态大模型,能够无缝处理文本、图像、音频和视频等多种输入形式,并通过实时流式响应同时生成文本与自然语音合成输出。
阿里巴巴开源的多模态大模型,参数规模为32B,具备强大的视觉和语言处理能力。
DeepSeek 团队发布的高性能开源大模型,具有强大的编程能力、数学推理能力以及高效的推理效率,广泛适用于多种应用场景。
高性能多模态 AI 模型,专为专业领域优化,具备强大的代码生成、多模态交互和深度推理能力。
Pad.ws 是一款集白板与代码编辑器功能于一体的在线协作工具,旨在为开发者和团队提供便捷的实时协作体验。