OpenAI GPT-OSS-120B与GPT-OSS-20B：OpenAI重磅推出的开源模型

AI开源项目多模态大模型

OpenAI最新发布的两款开源语言模型，旨在为开发者提供强大的推理能力和灵活的部署选项。

链接直达手机查看

GPT-OSS-120B与GPT-OSS-20B是OpenAI最新发布的两款开源语言模型，旨在为开发者提供强大的推理能力和灵活的部署选项。

一、主要功能

强大的推理能力
- GPT-OSS-120B和GPT-OSS-20B在推理任务上表现出色，能够处理复杂的逻辑问题和数学计算。
- 支持链式推理（Chain-of-Thought），可逐步展示推理过程，便于调试和验证。
高效的工具使用
- 这两款模型能够熟练使用网页搜索、Python代码执行等工具，展现出强大的“代理（agentic）”能力。
- 支持少样本函数调用，适合构建智能体工作流。
灵活的部署选项
- GPT-OSS-120B可在单张80GB的H100 GPU上高效运行，适合云端部署。
- GPT-OSS-20B仅需16GB内存，可在普通笔记本电脑或边缘设备上运行。
可定制性
- 用户可以对模型进行微调，以适应特定的应用场景。
- 提供完整的思维链（CoT），并支持结构化输出。

二、技术原理

Mixture-of-Experts（MoE）架构
- GPT-OSS-120B采用128专家Top-4的MoE架构，GPT-OSS-20B采用32专家Top-4的MoE架构。
- 每层仅激活部分专家，大幅降低了推理时的显存占用。
原生MXFP4量化
- 在训练阶段使用4.25 bit/参数的精度，避免了训练后量化可能带来的性能下降。
注意力机制优化
- 使用Rotary Position Embedding（RoPE）和Grouped Query Attention，支持最长128K的上下文。
- 交替采用“全局上下文”与“滑动128 Token窗口”机制。

三、应用场景

企业级应用
- GPT-OSS-120B适合需要强大推理能力和高计算资源的企业级应用。
- 可用于数据分析、代码生成、智能客服等领域。
本地部署
- GPT-OSS-20B适合在本地设备上运行，如高端笔记本电脑或台式机。
- 适用于需要快速迭代和低延迟的应用场景。
智能体开发
- 两款模型都支持工具调用和结构化输出，适合构建智能体工作流。
- 可用于开发对话智能体、浏览器助手、数据分析助手等。

四、使用方法

本地部署
- 可通过Ollama、Hugging Face等平台进行本地部署。
- 使用Transformers、vLLM等工具进行推理。
云端部署
- 支持AWS SageMaker、Databricks、Azure Foundry等云平台。
- 适合企业级大规模调用。
微调
- 用户可以根据具体需求对模型进行微调，以优化性能。

五、适用人群

开发者
- 适合需要在本地或云端部署语言模型的开发者。
- 提供了丰富的开发工具和API支持。
企业用户
- 适合需要高性能推理能力的企业，尤其是对数据安全和隐私有要求的场景。
研究人员
- 提供了模型权重和推理脚本，适合进行二次开发和研究。

六、优缺点介绍

优点

性能强大：在推理任务中表现出色，接近OpenAI内部的o3-mini和o4-mini模型。
灵活部署：支持本地和云端部署，适应多种硬件环境。
可定制性强：用户可以对模型进行微调，以满足特定需求。
开源许可：采用Apache 2.0许可证，允许自由使用、修改和分发。

缺点

非完全开源：虽然模型权重开放，但训练代码和数据集未公开。
硬件要求高：GPT-OSS-120B需要高性能GPU支持，GPT-OSS-20B也需要至少16GB内存。
推理延迟：高推理强度可能导致响应时间变长。

分类标签推荐：人工智能、开源模型、推理工具、自然语言处理

相关导航

Hpcaitech Open-Sora

Open-Sora是一个由hpcaitech开源的类Sora架构视频生成模型，它基于Diffusion Transformer（DiT）架构，旨在通过文本描述生成高质量的视频内容。该项目涵盖了整个视频生成模型的训练过程，包括数据处理、训练细节和模型检查点，供对文生视频模型感兴趣的人免费学习和使用。

Microsoft GraphRAG

GraphRAG，是一种基于图的RAG（检索增强生成）技术。GraphRAG旨在通过构建知识图谱来增强大模型在搜索、问答、摘要和推理等方面的能力。

天工开源架构DeepResearchAgent：高效多智能体系统助力复杂任务自动化解决

分层多智能体系统，专为深度研究任务和通用任务解决而设计，通过顶层规划智能体协调多个专业底层智能体，实现任务的自动分解和高效执行。

Hugging Face OpenAI-Gradio AI构建网页应用工具

该工具让开发者可以在几分钟内启动AI应用，无需庞大团队和复杂的技术基础。对于企业而言，这意味着能够快速推出AI项目，提升创新能力，加速技术转化。

免责声明：本站为个人资讯、工具类学习博客，所发布的一切形式的内容，包括但不限于文字、链接、工具、图片、视频、软件等，仅限用于学习和研究目的，不得将上述内容用于商业或者非法用途，否则，一切后果请用户自负。本站信息来自网络，如有侵权请联系本站删除下架，您必须在下载后的24个小时之内，从您的电脑中彻底删除上述内容。访问和下载本站内容，说明您已同意上述条款。本站为非盈利性站点，本站不贩卖软件，所有内容不作为商业行为，点击、使用相关工具时请注意甄别，谨防上当受骗。咨询联系：yumiok88@gmail.com.