OpenAI 开源了! 本地直接安装部署 gpt-OSS,支持Windows、macOS、Linux!

就在刚刚,OpenAI 发布了 gpt-oss-120b 和 gpt-oss-20b——两款性能卓越的开放轻量级语言模型,可在低成本下实现强大的实际应用性能。这些模型在灵活的 Apache 2.0 许可证下提供,与同等规模的开放模型相比,在推理任务中表现更优,展现出强大的工具使用能力,并针对在消费级硬件上高效部署进行了优化。它们通过强化学习与 OpenAI 最先进内部模型(包括 o3 及其他前沿系统)所启发的技术相结合进行训练。

a567a8b23d20250806090605

模型选择:

  • gpt-oss-120b— 适用于生产、通用、高推理用例,适合单个 H100 GPU(117B 参数,其中 5.1B 活动参数)
  • gpt-oss-20b— 适用于较低延迟和本地或特殊用例(210 亿个参数,其中 36 亿个活动参数)

这两个模型都是使用OpenAI的和声反应格式进行训练的,并且只能与这种格式一起使用;否则,它们将无法正常工作。

亮点

  • 宽松的 Apache 2.0 许可证:自由构建,不受版权限制或专利风险 – 非常适合实验、定制和商业部署。
  • 可配置的推理力度:根据您的具体用例和延迟需求轻松调整推理力度(低、中、高)。
  • 完整的思路链:提供对模型推理过程的完整访问权限,从而简化调试并增强输出的可信度。此信息不打算向最终用户显示。
  • 可微调:通过参数微调完全根据您的特定用例定制模型。
  • Agentic 功能:使用模型的本机功能进行函数调用、网页浏览Python 代码执行和结构化输出。
  • 原生 MXFP4 量化:模型使用原生 MXFP4 精度针对 MoE 层进行训练,允许gpt-oss-120b在单个 H100 GPU 上运行并gpt-oss-20b在 16GB 内存内运行。

安装要求

  • python 3.12 【点击下载
  • 在 macOS 上:安装 Xcode CLI 工具 –>xcode-select --install
  • 在 Linux 上:这些参考实现需要 CUDA
  • 在 Windows 上:如果您想在本地运行模型,请尝试使用 Ollama 等解决方案。

如果您尝试在消费类硬件上运行,你可以有2种安装方式:

1、在安装 Ollama上进行部署, 点击下载【官方版】后运行以下命令来使用 Ollama 。

# gpt-oss-20b
ollama pull gpt-oss:20b
ollama run gpt-oss:20b

# gpt-oss-120b
ollama pull gpt-oss:120b
ollama run gpt-oss:120b

 

71d930bd9920250806125214

 

2、在 LM Studio 上部署 ,如果您使用LM Studio,则可以使用以下命令进行下载。

# gpt-oss-20b
lms get openai/gpt-oss-20b
# gpt-oss-120b
lms get openai/gpt-oss-120b

3、如果需要下载原尺寸模型,您可以直接从 Hugging Face CLI下载Hugging Face Hub中的模型权重:

# gpt-oss-120b
huggingface-cli download openai/gpt-oss-120b --include "original/*" --local-dir gpt-oss-120b/

# gpt-oss-20b
huggingface-cli download openai/gpt-oss-20b --include "original/*" --local-dir gpt-oss-20b/
THE END
点赞1759 分享
相关推荐
Windows 10 上有什么值得推荐的软件?这6款绝对可以堪称神器!-零度会员
Windows 10 最实用的十个快捷键!-零度会员

Windows 10 最实用的十个快捷键!

熟练运用Windows 10上的这十个非常实用的快捷键,将会给我们在工作及学习上带来巨大的便利! https://youtu.be/Mz_IT2vtPTw
Edge浏览器测试可变刷新率支持 在滚动时更加流畅-零度会员

Edge浏览器测试可变刷新率支持 在滚动时更加流畅

可变刷新率主要应用在智能手机和智能手表方面,但微软正将该功能引入到桌面。 通过 Windows 10 系统中的 Variable Refresh Rate 功能,和 Windows 11 系统中的 Dynamic Refresh Rate 功能,在用...
admin的头像-零度会员admin
1.6W+2251
GitHub 今晚罕见地出现长时间中断,现已恢复运行-零度会员

GitHub 今晚罕见地出现长时间中断,现已恢复运行

微软拥有并运营的另一项热门在线服务也经历了长时间的停机。这次是 GitHub 开发人员服务和代码存储库服务,周三晚上遭遇了中断。 今天晚上美国东部时间 7 点刚过,DownDetector显示 GitHub 用户...
admin的头像-零度会员admin
2W+2176
这里就是一个巨大的农场.... 看零度邋遢的一天就知道了! | 零度解说-零度会员
EpiCRealism 下载量高达27万的冠军级真人模型,推荐NO.3-零度会员

EpiCRealism 下载量高达27万的冠军级真人模型,推荐NO.3

EpiCRealism:下载量高达27万的冠军级真人模型,与其他真人模型相比,它的人物形象不容易被认为是生成的AI脸,非常适合生成逼真的照片。 【点击下载】epiCRealism 模型   生成参数: photo...
admin的头像-零度会员admin
1.8W+1684
找回150枚比特币!价值1000万美金,如果你能花出去,免费奉送!| 零度解说-零度会员

找回150枚比特币!价值1000万美金,如果你能花出去,免费奉送!| 零度解说

https://www.youtube.com/watch?v=Krmh8Iy3Uy4 ================ 150枚比特币文件下载:https://www.lingdu80.com/12578.html
admin的头像-零度会员admin
2.2W+2178
安卓 iPhone手机上最安全的5款比特币钱包-零度会员

安卓 iPhone手机上最安全的5款比特币钱包

安全钱包的数据推荐来源bitcoin的官方网站   安卓手机:https://bitcoin.org/en/choose-your-wallet?step=5&platform=android&user=experienced iPhone手机:https://bitcoin.org/...
admin的头像-零度会员admin
1.8W+2251
为什么是时候重新发明浏览器了!-零度会员

为什么是时候重新发明浏览器了!

Darin Fisher 从一开始就一直在研究浏览器。他已经准备好最终建造他一直在等待的那个。  他构建了许多网络浏览器。很多网络浏览器。在他职业生涯的早期,他是Netscape的一名软件工程师,从事 N...
admin的头像-零度会员admin
1.7W+2252