马斯克开源Grok-1:史上最大3140亿参数模型,权重架构全面公开,附最新下载地址

图片[1]-马斯克开源Grok-1:史上最大3140亿参数模型,权重架构全面公开,附最新下载地址-零度会员

马斯克的xAI公司正式开源了3140亿参数的大型语言模型Grok-1,包括权重和网络架构。这使Grok-1成为目前参数量最大的开源大语言模型。Grok-1采用混合专家(MoE)架构,在给定token上的激活权重为25%。xAI在2023年10月使用自定义训练堆栈从头训练了该模型,并遵守Apache 2.0许可证开源。

1.Grok-1 开源模型下载:【磁力链接】 ,然后使用 【Torrent 客户端】进行下载即可!

2.Grok 开源项目:【Githubg 官方下载】或【网盘下载

3.如果需要在云端安装Grok-1大模型,可以通过【租赁H100 云GPU】进行云端搭建

4.当然也可以直接调用HuggingFace 🤗 Hub:

git clone https://github.com/xai-org/grok-1.git && cd grok-1
pip install huggingface_hub[hf_transfer]
huggingface-cli download xai-org/grok-1 --repo-type model --include ckpt-0/* --local-dir checkpoints --local-dir-use-symlinks False

模型详情:

  • 基于大量文本数据训练,未针对任何特定任务微调
  • 3140亿参数MoE模型,激活权重25%
  • 使用旋转嵌入而非固定位置嵌入
  • Tokenizer词汇大小131,072,嵌入大小6,144
  • 64层Transformer,每层解码器层包含多头注意力块和密集块
  • 多头注意力:48头查询,8头键/值,键值大小128
  • 密集块:加宽因子8,隐藏层大小32768
  • 每个token从8个专家选择2个
  • 旋转位置嵌入大小6,144
  • 上下文长度8192 tokens,精度bf16

模型能力:

  • 在标准LM基准测试中表现超过同等计算量模型
  • HumanEval编码任务63.2%,MMLU 73%
  • 在匈牙利高中数学考试中获C级(59%)
  • 整体在推理和编码任务中表现出色

局限性:

  • 缺少独立搜索网络能力,需结合搜索工具增强
  • 可能产生幻觉,需人工审查
  • 目前无法像X平台付费版实现实时获取信息

开源意义:

  • 遵循Apache 2.0许可证,用户可自由使用修改分发
  • 体现了xAI追求透明化和社区开放的理念
  • 为进一步研究和创新提供了宝贵资源

总的来说,Grok-1作为一款大规模开源语言模型,在模型能力和透明度方面都具有重要意义,值得业内外人士关注和探索。当然,模型的实际应用还需要结合其他工具和人工审查,以发挥其最大潜能。

THE END
点赞1529 分享
相关推荐
Claude 3 终于发布手机客户端了!可免费下载使用-零度会员

Claude 3 终于发布手机客户端了!可免费下载使用

5月1日,人工智能初创公司Anthropic宣布其大型模型产品Claude的移动应用正式上线。相较于ChatGPT、Gemini等竞争对手,Claude的推出显得稍显迟缓。 Anthropic的产品经理斯科特·怀特(Scott Whit...
admin的头像-零度会员admin
1.4W+1528
ChatGPT 目前不可用,宕机!已查明原因,正积极修复-零度会员

ChatGPT 目前不可用,宕机!已查明原因,正积极修复

 2024 12.12 ChatGPT出现全球宕机,打开官网或者PC客户端、手机端全部显示: ChatGPT 目前不可用。 状态:已识别 — 我们已经识别出该问题并正在努力推出修复程序。不知道的人还以为是自己的...
admin的头像-零度会员admin
94622130
电脑无法安装 Windows 11 的解决方法!升级前务必开启这2个功能 | 零度解说-零度会员
Windows 98 系统中文版 ISO下载 【含简体/繁体版】-零度会员

Windows 98 系统中文版 ISO下载 【含简体/繁体版】

Windows 98 是微软在1998年推出的电脑操作系统,是第二个基于DOS的混合的16位/32位Windows系统,是Windows 9x系列的一部分,其版本号为4.1,开发代号为Memphis。于1998年5月15日发行RTM版本,零...
admin的头像-零度会员admin
1.8W+1751
家庭火灾最常见但被忽视的5大原因!-零度会员

家庭火灾最常见但被忽视的5大原因!

谈到消防安全,大多数人往往属于以下两类人之一: 那些经常担心自己家和他们进入的任何其他建筑物中的火灾隐患的人(此时他们会立即在脑海中制定出最佳逃生路径)发生紧急情况),以及对火灾如...
admin的头像-零度会员admin
1.6W+2251
Google 用带有怀旧徽标的涂鸦庆祝其 25 岁生日-零度会员

Google 用带有怀旧徽标的涂鸦庆祝其 25 岁生日

  作为全球最受欢迎的搜索引擎和科技巨头 Google 今天庆祝其 25 岁生日。为了纪念这一时刻,谷歌发布了一幅怀旧涂鸦,展示了过去 25 年来其徽标的演变。 该涂鸦包含一个动画 GIF,将徽标从...
admin的头像-零度会员admin
1.7W+1682
Ashampoo® WinOptimizer 25 系统优化软件,限时免费($300-0)! 切勿错过-零度会员

Ashampoo® WinOptimizer 25 系统优化软件,限时免费($300-0)! 切勿错过

Ashampoo® WinOptimizer 25  Windows 系统优化软件,限时免费($300-0) Ashampoo系统优化软件功能十分丰富:具有垃圾清理、系统优化、安全防护、启动项管理、网络加速、进程管理、软件卸载、...
admin的头像-零度会员admin
1.5W+1527
黑客声称要出售 4 亿用户的 Twitter 数据-零度会员

黑客声称要出售 4 亿用户的 Twitter 数据

一名威胁行为者声称要出售 2021 年使用现已修复的 API 漏洞收集的 4 亿 Twitter 用户的公共和私人数据。他们要价 200,000 美元进行独家销售。 所谓的数据转储由名为“Ryushi”的威胁行为者在 Br...
admin的头像-零度会员admin
1.3W+6539
VT4browsers  附件下载自动查杀、安全检测插件-零度会员

VT4browsers 附件下载自动查杀、安全检测插件

当你从网上下载某个文件前会弹出安全询问,或者右击某个超链接时,可以方便提交到 VT 进行扫描     Virustotal 是一项免费的在线服务,可分析文件和 URL,从而识别防病毒引擎和网站扫...