马斯克开源Grok-1:史上最大3140亿参数模型,权重架构全面公开,附最新下载地址

图片[1]-马斯克开源Grok-1:史上最大3140亿参数模型,权重架构全面公开,附最新下载地址-零度会员

马斯克的xAI公司正式开源了3140亿参数的大型语言模型Grok-1,包括权重和网络架构。这使Grok-1成为目前参数量最大的开源大语言模型。Grok-1采用混合专家(MoE)架构,在给定token上的激活权重为25%。xAI在2023年10月使用自定义训练堆栈从头训练了该模型,并遵守Apache 2.0许可证开源。

1.Grok-1 开源模型下载:【磁力链接】 ,然后使用 【Torrent 客户端】进行下载即可!

2.Grok 开源项目:【Githubg 官方下载】或【网盘下载

3.如果需要在云端安装Grok-1大模型,可以通过【租赁H100 云GPU】进行云端搭建

4.当然也可以直接调用HuggingFace 🤗 Hub:

git clone https://github.com/xai-org/grok-1.git && cd grok-1
pip install huggingface_hub[hf_transfer]
huggingface-cli download xai-org/grok-1 --repo-type model --include ckpt-0/* --local-dir checkpoints --local-dir-use-symlinks False

模型详情:

  • 基于大量文本数据训练,未针对任何特定任务微调
  • 3140亿参数MoE模型,激活权重25%
  • 使用旋转嵌入而非固定位置嵌入
  • Tokenizer词汇大小131,072,嵌入大小6,144
  • 64层Transformer,每层解码器层包含多头注意力块和密集块
  • 多头注意力:48头查询,8头键/值,键值大小128
  • 密集块:加宽因子8,隐藏层大小32768
  • 每个token从8个专家选择2个
  • 旋转位置嵌入大小6,144
  • 上下文长度8192 tokens,精度bf16

模型能力:

  • 在标准LM基准测试中表现超过同等计算量模型
  • HumanEval编码任务63.2%,MMLU 73%
  • 在匈牙利高中数学考试中获C级(59%)
  • 整体在推理和编码任务中表现出色

局限性:

  • 缺少独立搜索网络能力,需结合搜索工具增强
  • 可能产生幻觉,需人工审查
  • 目前无法像X平台付费版实现实时获取信息

开源意义:

  • 遵循Apache 2.0许可证,用户可自由使用修改分发
  • 体现了xAI追求透明化和社区开放的理念
  • 为进一步研究和创新提供了宝贵资源

总的来说,Grok-1作为一款大规模开源语言模型,在模型能力和透明度方面都具有重要意义,值得业内外人士关注和探索。当然,模型的实际应用还需要结合其他工具和人工审查,以发挥其最大潜能。

THE END
点赞1529 分享
Windows 11 最新安装教程,永久免费激活!( 附ISO镜像下载 ) | 零度解说-零度会员

Windows 11 最新安装教程,永久免费激活!( 附ISO镜像下载 ) | 零度解说

https://youtu.be/8QjfP0znSVA   Window 11 ISO 下载:【点击前往】
admin的头像-零度会员admin
1.2W+3250
Captura(卡普图拉)免费开源的屏幕录制软件-零度会员

Captura(卡普图拉)免费开源的屏幕录制软件

Captura是一款完全免费且开源的电脑屏幕录制工具 主要功能: 捕获屏幕,网络摄像头,音频,光标,鼠标单击和击键 适用于Windows系统 需要:NET 4.7.2及以上的环境支持 下载地址:https://mathew...
100% 由 AI 拍摄的《红楼梦》视频,1分钟让你看完四大名著之一 | 零度解说-零度会员

100% 由 AI 拍摄的《红楼梦》视频,1分钟让你看完四大名著之一 | 零度解说

https://www.youtube.com/watch?v=NDh24E6_86g   AI 版《红楼梦》视频提示词获取:https://www.lingdu80.com/14729.html
admin的头像-零度会员admin
2.2W+3252
完美解决电脑图片、视频不显示缩略图的问题! K-Lite 编解码器包-零度会员

完美解决电脑图片、视频不显示缩略图的问题! K-Lite 编解码器包

K-Lite 编解码器包有四种不同的变体。范围从仅包含最基本解码器的非常小的捆绑包到大型且更全面的捆绑包。变体之间的全局差异可以在下面找到。具体差异可以通过能力对比和内容页面对比来发现。 ...
admin的头像-零度会员admin
1.5W+1527
谷歌Bard正式支持免费生图功能,无限使用!顶流模型大混战开始了-零度会员

谷歌Bard正式支持免费生图功能,无限使用!顶流模型大混战开始了

Google宣布Bard新增图像生成功能,只需要给Bard一段文字描述,例如:创造一张狗在冲浪板冲浪的图片,“Create an image of a dog riding on a surfboard”,Bard就能生成出客制化且种类多元的图...
admin的头像-零度会员admin
1.4W+1527
Meta Llama 3 正式发布!如何在线体验和本地安装部署?-零度会员

Meta Llama 3 正式发布!如何在线体验和本地安装部署?

Meta 宣布推出下一代开源大语言模型Llama 3,标志着AI发展新里程碑。该模型分为80亿和700亿参数两个版本,被誉为'Llama 2的重大飞跃',为大规模语言模型树立新标杆。 值得一提的是,Llama 3已与Meta...
admin的头像-零度会员admin
2.2W+2176
智能手机车载出风口的隐患-零度会员

智能手机车载出风口的隐患

我们大多数人在开车时使用手机播放音乐或使用 GPS 导航。因此,我们需要将手机安装在开车时可以看到的地方(当然是免提!)。有许多不同的方法可以做到这一点,例如仪表板支架、磁性支架和夹在...
admin的头像-零度会员admin
1.6W+2251
不花一分钱!最强翻译神器 RTranslator,支持50+语言+离线使用!完全免费开源-零度会员

不花一分钱!最强翻译神器 RTranslator,支持50+语言+离线使用!完全免费开源

想找一款真正免费、强大又离线可用的手机AI翻译神器? 那你绝不能错过——RTranslator!📱开源透明、永久无广告💡支持超50种语言,涵盖文本翻译、实时同声传译,甚至还能蓝牙对话!🚀搭载Meta的...
admin的头像-零度会员admin
3.8W+1035
为什么你应该切换到 Android 安卓手机!-零度会员

为什么你应该切换到 Android 安卓手机!

苹果擅长他们的工作。他们制造的产品易于设置和使用,但在不知不觉中,您会觉得自己完全被困在了他们的生态系统中。现在,对我们中的许多人来说,这还不错。生态系统有很多好处,这里的生活似乎...
admin的头像-零度会员admin
1.6W+2252