DeepSeek-V2是一款基于2千亿参数量的MoE(Mixture of Experts)模型的AI技术产品,它在对话官网和API上全面上线,提供领先性能和超低价格。
Nemotron-4是英伟达推出的一系列开放模型,旨在生成合成数据以训练不同行业的大型语言模型(LLMs)。该模型系列为开发人员提供了一种免费、可扩展的解决方案,用于创建类似真实数据特征的合成数据,以支持大型语言模型的训练和改进。
YaFSDP是由俄罗斯科技巨头Yandex公司开源的一款大型语言模型(LLM)训练工具。它旨在通过优化GPU通信和减少内存使用量,来提高LLM训练的效率,并节省高达20%的GPU资源。
该论文提出了一种全新的神经网络架构——Transformer,它完全基于注意力(Attention)机制,彻底抛弃了传统的循环神经网络(RNN)或卷积神经网络(CNN)结构。Transformer模型通过自注意力(Self-Attention)机制来计算输入序列中不同位置之间的相关性,从而实现对序列数据的高效处理。这种架构具有出色的并行计算能力,大大提高了自然语言处理任务的效率。
腾讯AI Lab是腾讯公司的人工智能实验室,致力于人工智能领域的前沿研究和应用开发,推动AI技术的发展和创新。
Aurora是微软发布的一个大规模大气基础模型,旨在利用人工智能技术预测全球范围内的极端天气事件。该模型通过深度学习技术,对大量气象数据进行训练,以捕捉大气中错综复杂的模式和结构。
南京大经中医药信息技术有限公司是由中医专家团队和信息化专家团队共同创立的国家级高新技术企业,是中医信息化、智能化行业的开创者和领军者,在名老中医诊疗经验的数字化传承和中医临床智能辅助诊疗系统的开发等领域具有深厚的技术积淀。
Earth-2 是 NVIDIA 计划打造的全球最强大的人工智能超级计算机,其主要功能是预测气候变化。该系统将在 Omniverse 中创造一个地球的数字孪生,以实现对全球不同区域未来几十年气候变化的模拟和预测。
麦肯锡官网,提供关于业务介绍、行业洞察、最新研究、咨询服务以及职业发展机会等信息。
PCM在图像处理方面有着更快更稳定的表现。PCM针对LCM的问题进行了改进,扩展了模型的应用范围,提高了图像和动画生成的质量。对于动画制作者来说,PCM的优化意味着节省后期处理时间,加快制作流程。未来在扩散模型领域有望迎来更多创新和突破。
若愚科技是一家专注于人工智能领域的科技公司,其主要成果之一是推出了具有自主知识产权的“九天机器人大脑”。
Phi-3-vision-128k-instruct是Phi-3家族中的第一个多模态模型,拥有4.2B参数,支持128K的上下文长度。该模型结合了语言和视觉处理能力,能够在多种设备上高效地处理和响应图像及文本数据。
ERNIE Lite是由百度智能云发布的轻量级大模型,旨在在特定场景下作为基座模型进行精调,兼顾模型效果与推理性能,并搭载低算力AI加速卡进行推理,以适应极致低成本和低延迟应用。
ERNIE Speed是百度自研的一款轻量级大语言模型,旨在更快速地响应用户需求,同时支持少量数据微调,大幅缩短训练时间。其特定场景下的效果可媲美ERNIE Bot4.0模型,并且具有出色的上下文理解能力和推理性能。
更强模型,更低价格,更易落地 字节跳动推出的自研大模型。通过字节跳动内部50+业务场景实践验证,每日千亿级tokens大使用量持续打磨,提供多模态能力,以优质模型效果为企业打造丰富的业务体验。
从 Chrome 126 开始,将最小的 AI 模型 Gemini Nano 直接构建到 Chrome 桌面客户端中。
谷歌预览了 Gemini 中名为 Gemini Live 的新体验,它可以让用户在智能手机上与 Gemini 进行“深入”的语音聊天。
Gemini Flash 是 DeepMind 公司开发的一项技术,它在多个领域表现出色,包括语言理解、代码生成、数学问题解答、多步推理、多语言翻译、图像理解、音频识别和视频问答。
领先的人工智能 数据服务平台 企业级AI训练数据 SaaS 平台
零一万物大模型开放平台简介零一万物大模型开放平台是一个提供多种AI模型服务的平台,旨在满足不同用户对文本生成[…]
GPT-4o是OpenAI发布的一款全新AI模型,其中的“o”代表“omni”,意为全面、全能。GPT-4o的发布标志着向更自然的人机交互迈出重要一步,它能够接受文本、音频和图像的任意组合输入,并生成文本、音频和图像的任意组合输出。
DeepSeek-V2 基于 2 千亿 MoE 模型底座,领先性能,超低价格,越级场景体验,已在对话官网和 API 全面上线。
Refuel.ai是一个专注于数据标注和清洗的开源平台,其核心产品RefuelLLM-2是一款先进的语言模型,旨在提高数据处理的效率和准确性。
Maimo 是一个旨在提高信息处理效率的智能平台,它通过自动化技术帮助用户快速从各种内容源中提取关键信息。
NeMo-Aligner 是由英伟达研究人员开源的安全对齐框架,旨在提升大型语言模型的安全性和稳定性。
Phi-3 WebGPU是一款结合了Transformers.js和onnxruntime-web的AI模型,它利用WebGPU加速技术,提供超过20t/s的处理速度,并且所有数据处理在本地完成,确保用户隐私安全。尽管在中文回答上存在一些不足,但其在浏览器中提供的AI模型运行能力仍然值得关注。
Stability AI 推出了 Stable Artisan,这是一款支持使用 Developer Platform API 创建高质量媒体的 AI 工具,包含 Stable Diffusion 3 等高级模型,能够生成和编辑图像,并支持多种图像处理功能,以及用文字或图像创作精细视频。
X.ai 博客是一个发布关于人工智能(AI)模型、工具和研究的平台。
通义千问2.5是阿里云推出的一款先进的中文大模型,它代表了当前中文AI领域的顶尖技术水平。
Stability AI是一个人工智能平台,旨在通过为人们建立一个由人们开发的AI基础,激发人类的潜能。
虎博科技是一家专注NLP(自然语言处理)的公司,致力于大数据AI(人工智能)和语义分析识别数据挖掘等领域
InternLM 是在过万亿 token 数据上训练的多语千亿参数基座模型。通过多阶段的渐进式训练,InternLM 基座模型具有较高的知识水平,在中英文阅读理解、推理任务等需要较强思维能力的场景下性能优秀,在多种面向人类设计的综合性考试中表现突出。
元乘象Chatimg 多模态对话大模型 主打“看懂世界”,擅长“以图生文”
云雀(Skylark)是字节跳动研发的一款语言模型,它通过自然语言交互,能够高效完成互动对话、信息获取、协助创作等任务。用户可以通过简单的API调用,快速搭建基于大模型的AI应用。
云知声AI开放平台的山海大模型是一款基于通用大模型,并结合行业特色数据与知识进行深度学习的人工智能服务产品。该模型以模型即服务(MaaS)为基础设施,旨在为各行各业提供数字专家级的智能服务。
云从科技的从容大模型是云从科技推出的一款人工智能模型,旨在提供高效的机器学习服务。
“兆言”已经在智能客服、数字政务、IT智能运维、高校智慧招生、企业智能营销等多个领域和场景中成功落地应用,展现了其广泛的应用潜力和实用价值。
SuperCLUE是一个专注于人工智能模型性能评估和排名的平台。它提供了一个总排行榜,展示了不同机构开发的AI模型在特定测试中的得分和排名情况。
。该方法通过多模态注意力机制,将视频和文本特征进行融合,并利用多语言翻译模型将不同语言的文本特征进行转换,从而实现跨语言的视频-文本检索。实验结果表明,该方法在多语言视频-文本检索任务上取得了较好的效果。
通过共同开发开放模型、数据集、系统和评估工具,使每个人都可以访问大型模型。
Palantir是一家数据分析公司,提供企业级软件平台,用于数据集成、分析和可视化。其产品之一是AIP(Analytic Integration Platform),这是一个分析集成平台,旨在帮助组织更有效地处理和分析大量数据。
Qwen1.5-110B采用了与其他Qwen1.5模型相同的Transformer解码器架构,并引入了分组查询注意力(GQA)机制,在模型推理时更加高效。该模型支持32K tokens的上下文长度,同时仍然是多语言的,支持英、中、法、西、德、俄、日、韩、越、阿等多种语言。
Qwen1.5-110B-Chat模型是一个基于大规模数据训练的人工智能对话系统,它能够理解并生成自然语言,进行有效的对话交互。
一种新的视频超分辨率(VSR)模型,旨在生成具有高频细节和时间一致性的视频。
专注于提供企业级IT服务,特别是在云计算和大数据时代的智能IT运维产品和解决方案。
智拓是拓尔思公司推出的基于深度学习的语义智能技术平台,围绕自然语言处理(NLP)、知识图谱、图像检索等核心技术,提供全栈AI服务能力,旨在帮助用户快速构建AI技术能力,提升行业服务效果。
国产自主可控,生态开放,垂直领域知识开源增强,具备多参数、多领域、多语言、多技能的核心能力,旨在通过大模型技术赋能各行各业,推动政企数智化转型。
来自Meta的研究人员推出了SceneScript,只需要70M参数,仅采用编码器解码器架构,就能将真实世界的场景转化为几何表示。
MiniMax是一家提供智能AI服务的公司,旨在通过先进的AI技术助力企业和开发者快速搭建AI应用。
零一万物是一家专注于AI 2.0大模型技术和应用的全球公司,致力于通过先进的人工智能技术推动行业发展。
生成式人工智能驱动型助手,专为针对您的业务定制的工作而设计
Amazon Titan 是亚马逊公司于 2023 年 10 月发布的一款基于云计算的图形数据库服务。它能够存储和处理海量规模的图数据,并提供高效的查询和分析功能。
亚马逊云科技的大模型托管平台Amazon Bedrock集成了全球7家头部模型公司的20多种优选大模型。 简单理解,Bedrock就像模型的超市。
华为HarmonyOS是一个面向智能设备的操作系统,旨在为不同设备提供统一的智能化、互联与协同能力。
上海AI Lab和香港中文大学等研究机构联合开发的多模态大模型InternLM-XComposer2-4KHD(简称IXC2-4KHD),该模型能够自动分析PDF、网页、海报、Excel图表内容。
Snowflake Arctic 是一个创新的平台,旨在为语言模型提供一个开放且高效的基础。这是一个基于云的解决方案,使组织能够高效地存储、处理和分析大量的非结构化文本数据。
Samsung Galaxy AI是三星为其Galaxy系列手机开发的一套人工智能解决方案,旨在为用户提供更高效、便捷的智能体验。
Phi-3-mini-128k-instruct是微软发布的轻量级语言模型Phi-3系列中的最小版本。它拥有38亿参数,相较于大型模型,其在保持较高性能的同时,显著降低了计算资源的占用。该模型经过预训练,能够理解并处理自然语言文本,具备语言理解、生成和推理的能力。
OpenELM是由苹果公司开发的预训练模型,基于Transformer架构。该模型旨在实现高效且灵活的文本表示学习,能够捕捉文本中的语义和上下文信息。通过在大规模语料库上进行预训练,OpenELM能够生成文本的向量表示,为各种自然语言处理任务(如文本分类、情感分析、问答等)提供强大的基础。
出门问问(Chumen Wenwen)是一家中国的人工智能公司,提供包括智能手表、智能耳机等在内的智能硬件产品,同时也提供基于人工智能技术的软件服务。
DeepSeek-V2是一款基于2千亿参数量的MoE(Mixture of Experts)模型的AI技术产品,它在对话官网和API上全面上线,提供领先性能和超低价格。