OpenAI 开源了! 本地直接安装部署 gpt-OSS,支持Windows、macOS、Linux!

就在刚刚,OpenAI 发布了 gpt-oss-120b 和 gpt-oss-20b——两款性能卓越的开放轻量级语言模型,可在低成本下实现强大的实际应用性能。这些模型在灵活的 Apache 2.0 许可证下提供,与同等规模的开放模型相比,在推理任务中表现更优,展现出强大的工具使用能力,并针对在消费级硬件上高效部署进行了优化。它们通过强化学习与 OpenAI 最先进内部模型(包括 o3 及其他前沿系统)所启发的技术相结合进行训练。

a567a8b23d20250806090605

模型选择:

  • gpt-oss-120b— 适用于生产、通用、高推理用例,适合单个 H100 GPU(117B 参数,其中 5.1B 活动参数)
  • gpt-oss-20b— 适用于较低延迟和本地或特殊用例(210 亿个参数,其中 36 亿个活动参数)

这两个模型都是使用OpenAI的和声反应格式进行训练的,并且只能与这种格式一起使用;否则,它们将无法正常工作。

亮点

  • 宽松的 Apache 2.0 许可证:自由构建,不受版权限制或专利风险 – 非常适合实验、定制和商业部署。
  • 可配置的推理力度:根据您的具体用例和延迟需求轻松调整推理力度(低、中、高)。
  • 完整的思路链:提供对模型推理过程的完整访问权限,从而简化调试并增强输出的可信度。此信息不打算向最终用户显示。
  • 可微调:通过参数微调完全根据您的特定用例定制模型。
  • Agentic 功能:使用模型的本机功能进行函数调用、网页浏览Python 代码执行和结构化输出。
  • 原生 MXFP4 量化:模型使用原生 MXFP4 精度针对 MoE 层进行训练,允许gpt-oss-120b在单个 H100 GPU 上运行并gpt-oss-20b在 16GB 内存内运行。

安装要求

  • python 3.12 【点击下载
  • 在 macOS 上:安装 Xcode CLI 工具 –>xcode-select --install
  • 在 Linux 上:这些参考实现需要 CUDA
  • 在 Windows 上:如果您想在本地运行模型,请尝试使用 Ollama 等解决方案。

如果您尝试在消费类硬件上运行,你可以有2种安装方式:

1、在安装 Ollama上进行部署, 点击下载【官方版】后运行以下命令来使用 Ollama 。

# gpt-oss-20b
ollama pull gpt-oss:20b
ollama run gpt-oss:20b

# gpt-oss-120b
ollama pull gpt-oss:120b
ollama run gpt-oss:120b

 

71d930bd9920250806125214

 

2、在 LM Studio 上部署 ,如果您使用LM Studio,则可以使用以下命令进行下载。

# gpt-oss-20b
lms get openai/gpt-oss-20b
# gpt-oss-120b
lms get openai/gpt-oss-120b

3、如果需要下载原尺寸模型,您可以直接从 Hugging Face CLI下载Hugging Face Hub中的模型权重:

# gpt-oss-120b
huggingface-cli download openai/gpt-oss-120b --include "original/*" --local-dir gpt-oss-120b/

# gpt-oss-20b
huggingface-cli download openai/gpt-oss-20b --include "original/*" --local-dir gpt-oss-20b/
THE END
点赞1759 分享
相关推荐
Keyviz - 轻量级按键可视化工具!完全免费开源-零度会员

Keyviz – 轻量级按键可视化工具!完全免费开源

Keyviz - 轻量级按键可视化工具 在日常工作、录屏演示、线上教学或游戏直播中,很多时候我们希望观众能够直观地看到自己在键盘上输入了哪些按键,这样更容易跟随操作步骤。Keyviz 正是一款能够...
admin的头像-零度会员admin
1.5W+1695
如何在 Windows 11 中删除用户配置文件(3 种方法)-零度会员

如何在 Windows 11 中删除用户配置文件(3 种方法)

就像 Windows 10 一样,Windows 11 可以选择创建多个本地用户帐户,允许用户为使用计算机的每个用户创建单独的帐户。 在 techviral 上,我们已经分享了在 Windows 11 上添加本地用户帐户的分步...
admin的头像-零度会员admin
1.8W+2251
Midjourney 最简单易懂的注册和使用教程!无需邀请码-零度会员

Midjourney 最简单易懂的注册和使用教程!无需邀请码

  1.首先注册一个Discord账号: 【官网】 2.进入Midjourney官网平台:【链接】 3.使用命令:/imagine 4.提示词推荐: you're studying software engineering in high school and you find t...
admin的头像-零度会员admin
1.4W+6541
一键删除 Windows 自带的臃肿软件!只需这行代码,让你的电脑更高效运行!| 零度解说-零度会员
立即升级你的浏览器!谷歌 WebP 图片格式曝高危漏洞,Chrome、edge、火狐、Brave 等均受影响 !另推荐5个安全设置 | 零度解说-零度会员
Gemini 3 Pro 免费玩!只要一个Gmail邮箱即可搞定,无需信用卡、无需认证!-零度会员

Gemini 3 Pro 免费玩!只要一个Gmail邮箱即可搞定,无需信用卡、无需认证!

Google Gemini 3 Pro 以及全新的图像模型 Nano Banana Pro,近日迅速成为 AI 工具圈的热门话题。很多用户都想体验 Pro 版本的完整能力,但由于免费版使用额度非常有限(例如 Nano Banana Pro 每...
推荐8款非常实用的 “限时免费” 软件!切勿错过-零度会员

推荐8款非常实用的 “限时免费” 软件!切勿错过

 1.FOCUS Projects 4 Pro – 图像特效处理软件[Windows、macOS] [$99→零元购]这是一款图片锐度调节工具,能够将照片拍摄时不够清晰的部位更加清晰。同时软件中还有功能强大的图片编辑器,包含...
admin的头像-零度会员admin
1.8W+1683
本地部署 Llama3.1 最强开源大模型!支持 Windows、MacOS-零度会员

本地部署 Llama3.1 最强开源大模型!支持 Windows、MacOS

1.本地电脑安装的硬件要求:​ ​Windows:3060以上显卡+8G以上显存+16G内存,硬盘空间至少20G Mac:M1或M2芯片 16G内存,20G以上硬盘空间 在开始之前,首先我们需要安装Ollama客户端,来进行本...
admin的头像-零度会员admin
3W+2178
谷歌 Chrome浏览器中英文下载站!(离线安装包)!-零度会员

谷歌 Chrome浏览器中英文下载站!(离线安装包)!

  Chrome 浏览器官方下载 英文下载站【点击前往】或【下载离线安装包】 中文下载站【点击前往】或【下载离线安装包】 繁体下载站【点击前往】或【下载离线安装包】 推荐下载: 【离线安装...
admin的头像-零度会员admin
2.2W+2177