马斯克开源Grok-1:史上最大3140亿参数模型,权重架构全面公开,附最新下载地址

图片[1]-马斯克开源Grok-1:史上最大3140亿参数模型,权重架构全面公开,附最新下载地址-零度博客

马斯克的xAI公司正式开源了3140亿参数的大型语言模型Grok-1,包括权重和网络架构。这使Grok-1成为目前参数量最大的开源大语言模型。Grok-1采用混合专家(MoE)架构,在给定token上的激活权重为25%。xAI在2023年10月使用自定义训练堆栈从头训练了该模型,并遵守Apache 2.0许可证开源。

 

1.Grok-1 开源模型下载:【磁力链接】 ,然后使用 【Torrent 客户端】进行下载即可!

2.Grok 开源项目:【Githubg 官方下载】或【网盘下载

3.如果需要在云端安装Grok-1大模型,可以通过【租赁H100 云GPU】进行云端搭建

4.当然也可以直接调用HuggingFace 🤗 Hub:

git clone https://github.com/xai-org/grok-1.git && cd grok-1
pip install huggingface_hub[hf_transfer]
huggingface-cli download xai-org/grok-1 --repo-type model --include ckpt-0/* --local-dir checkpoints --local-dir-use-symlinks False

 

模型详情:

  • 基于大量文本数据训练,未针对任何特定任务微调
  • 3140亿参数MoE模型,激活权重25%
  • 使用旋转嵌入而非固定位置嵌入
  • Tokenizer词汇大小131,072,嵌入大小6,144
  • 64层Transformer,每层解码器层包含多头注意力块和密集块
  • 多头注意力:48头查询,8头键/值,键值大小128
  • 密集块:加宽因子8,隐藏层大小32768
  • 每个token从8个专家选择2个
  • 旋转位置嵌入大小6,144
  • 上下文长度8192 tokens,精度bf16

模型能力:

  • 在标准LM基准测试中表现超过同等计算量模型
  • HumanEval编码任务63.2%,MMLU 73%
  • 在匈牙利高中数学考试中获C级(59%)
  • 整体在推理和编码任务中表现出色

局限性:

  • 缺少独立搜索网络能力,需结合搜索工具增强
  • 可能产生幻觉,需人工审查
  • 目前无法像X平台付费版实现实时获取信息

开源意义:

  • 遵循Apache 2.0许可证,用户可自由使用修改分发
  • 体现了xAI追求透明化和社区开放的理念
  • 为进一步研究和创新提供了宝贵资源

 

总的来说,Grok-1作为一款大规模开源语言模型,在模型能力和透明度方面都具有重要意义,值得业内外人士关注和探索。当然,模型的实际应用还需要结合其他工具和人工审查,以发挥其最大潜能。

THE END
喜欢就支持一下吧
点赞1529 分享
炸翻全场!英伟达 CES 2025 发布会亮点回顾 :RTX50 显卡性能及价格,微型 AI 超算 + 中文直播内容全揭秘! | 零度解说-零度博客
2021年最值得推荐的五款免费精品软件-零度博客

2021年最值得推荐的五款免费精品软件

https://youtu.be/95vdNVQDaTk 火绒安全:https://www.huorong.cn/person5.html Recuva:https://www.ccleaner.com/recuva PotPlayer:https://potplayer.daum.net/ BleachBit:https://www.ble...
Ubuntu 24.04 LTS 正式发布!代号 “Noble Numbat”,性能提升明显-零度博客

Ubuntu 24.04 LTS 正式发布!代号 “Noble Numbat”,性能提升明显

Ubuntu 24.04 LTS 已正式发布,代号 “Noble Numbat”。 Canonical 首席执行官 Mark Shuttleworth 称 Ubuntu 24.04 LTS 会提供至少 12 年的支持,并在性能工程和机密计算方面提升明显,还集成了...
admin的头像-零度博客admin
2.1W+1529
Inpaint(图片修复、放大)神器!纯浏览器端实现,完全免费开源-零度博客

Inpaint(图片修复、放大)神器!纯浏览器端实现,完全免费开源

Inpaint 是一个免费的开源修复和图像放大工具,由浏览器上的 webgpu 和 wasm 提供支持。 基于Webgpu技术和wasm技术的开源免费图像修复工具,纯浏览器端实现。 在线体验:【点击前往】 开源项目...
admin的头像-零度博客admin
2.2W+2176
送福利!免费获取AWS云服务器!优质网络,速度超快!搭建网站、代理IP,直连电信、联通,线路超级良心!! | 零度解说-零度博客

送福利!免费获取AWS云服务器!优质网络,速度超快!搭建网站、代理IP,直连电信、联通,线路超级良心!! | 零度解说

https://youtu.be/delrbXy6pBY ------------------------------------- 🔔 1.亚马逊云服务器免费注册:https://mic.anruicloud.com/url/ldjs 2.Amazon云服务器搭建网站:https://www.lingdu80.c...
admin的头像-零度博客admin
1.4W+1528
Faceswap - 免费开源 又超级好用的换脸工具!-零度博客

Faceswap – 免费开源 又超级好用的换脸工具!

1.Faceswap 是领先的免费和开源多平台 Deepfakes 软件。由 Tensorflow、Keras 和 Python 提供支持;Faceswap 将在 Windows、macOS 和 Linux 上运行。 Faceswap 官网:【点击进入】备用下载:【...
admin的头像-零度博客admin
4.2W+2261
Photoshop美颜磨皮插件Imagenomic Portraiture 3.5.4 Win/Mac开心版-零度博客

Photoshop美颜磨皮插件Imagenomic Portraiture 3.5.4 Win/Mac开心版

Imagenomic已发布适用于Photoshop的Imagenomic Portraiture 3.5.4插件。 下一代皮肤平滑,修复和增强软件建立在版本2的技术之上, 速度和性能提高了一倍,并且输出质量细化可产生一致且令人愉悦...
免费白嫖AWS云服务器!搭建V2ray、VPN 可实现秒开4K视频,速度超快! 2023  | 零度解说-零度博客

免费白嫖AWS云服务器!搭建V2ray、VPN 可实现秒开4K视频,速度超快! 2023 | 零度解说

https://youtu.be/IsHKgRj6aY4   免费申请亚马逊云服务器的网站:https://www.lingdu80.com/7568.html
超真实 Stable Diffusion AI 大模型!完全免费,生成图片光效氛围感爆棚!!| 零度解说-零度博客

超真实 Stable Diffusion AI 大模型!完全免费,生成图片光效氛围感爆棚!!| 零度解说

这是基于 Stable Diffusion的真人大模型,生成的图片不仅非常好看,更有质感! 而且它还进一步解决了以往AI图片一脸假或者是网红脸的问题 现在我们就来演示一下........   https://youtu.b...
admin的头像-零度博客admin
2.1W+2176