DeepSeek-V3 的Q4_k_m 量化版本下载!

DeepSeek-V3 是由国人工智能公司DeepSeek开发的最新开源大型语言模型(LLM),于2024年12月发布。

该模型采用了混合专家(Mixture-of-Experts,MoE)架构,拥有总计6710亿参数,每个token激活其中的370亿参数。

在性能方面,DeepSeek-V3在多项基准测试中表现出色,超越了Llama 3.1和Qwen 2.5等模型,并与GPT-4o和Claude 3.5 Sonnet等先进的闭源模型相媲美。

以下是DeepSeek-V3与一些同类模型(如Llama 3.1、GPT-4、Claude 3.5 Sonnet、Qwen 2.5等)的参数对比表:

模型名称 总参数量 激活参数量 架构 推理速度 训练成本 发布时间
DeepSeek-V3 6710亿 370亿 混合专家(MoE) 60 tokens/s $5.58M 2024年12月
Llama 3.1 3200亿 3200亿 Transformer 25 tokens/s 未公开 2024年11月
GPT-4o 1万亿 1万亿 Transformer 15 tokens/s 超过$100M 2024年6月
Claude 3.5 8500亿 8500亿 Transformer 18 tokens/s 未公开 2024年10月
Qwen 2.5 4300亿 4300亿 基于Transformer改进 30 tokens/s 未公开 2024年11月

详细说明

  1. 总参数量:表示模型的总参数规模,通常决定了模型的容量。
  2. 激活参数量:对于MoE架构,表示每次推理激活的参数量;而标准Transformer架构通常等于总参数量。
  3. 架构:DeepSeek-V3采用混合专家架构,能够高效激活部分专家参数,从而提升推理速度和能效。
  4. 推理速度:DeepSeek-V3的推理速度领先,适合实时应用场景。
  5. 训练成本:DeepSeek-V3显示了开源模型在成本控制上的优势,与闭源模型(如GPT-4)形成鲜明对比。
  6. 发布时间:DeepSeek-V3是目前最新的开源模型之一,适应了最新的研究进展和需求。

图片[1]-DeepSeek-V3 的Q4_k_m 量化版本下载!-零度会员

此外,DeepSeek-V3在推理速度上也取得了显著突破,推理速度比之前的模型提高了3倍,达到每秒60个token。

值得注意的是,DeepSeek-V3的训练成本约为558万美元,耗时约55天,显示了在有限资源下的高效优化能力。

用户可以通过DeepSeek的官方网站免费体验DeepSeek-V3,或通过API进行集成。

此外,DeepSeek-V3的模型权重已在GitHub上开源,开发者可以下载并在本地进行部署。

总体而言,DeepSeek-V3作为开源模型,在性能和效率上均达到了当前的领先水平,为人工智能领域的研究和应用提供了强大的工具。

而且现在已经放出了 DeepSeek-V3 的Q4_k_m 量化版本了,大小比原本的小一半。

DeepSeek-V3 的Q4_k_m 量化版本:点击下载

图片[2]-DeepSeek-V3 的Q4_k_m 量化版本下载!-零度会员
THE END
点赞1628 分享
DeepSeek 多模态大模型Janus-Pro-7B,本地部署教程!支持图像识别和图像生成-零度会员

DeepSeek 多模态大模型Janus-Pro-7B,本地部署教程!支持图像识别和图像生成

DeepSeek 又深夜发大招!开源了多模态大模型Janus-Pro-7B,普通电脑可以直接安装使用,现在我们就来本地部署!支持图像识别和图像生成,性能非常强悍!1、检查自己是否安装了 Git 和 conda ,如...
admin的头像-零度会员admin
6.7W+1900
OpenAI 惨遭解体!结局却又大反转,不亏是ChatGPT年度最精彩的“宫斗”大片 !! 好莱坞都不敢这么拍,谁又是背后最大赢家? | 零度解说-零度会员
WindTerm 免费开源的SSH远程终端连接器!-零度会员

WindTerm 免费开源的SSH远程终端连接器!

WindTerm ,目前功能最全又最良心的SSH远程终端连接器【官方下载】【备用下载】特征SSH、Telnet、Tcp、Shell、串行实现了 SSH v2、Telnet、Raw Tcp、串行、Shell 协议。支持会话验证时 SSH 自动...
admin的头像-零度会员admin
2.5W+2179
如何在 Windows 11 中删除用户配置文件(3 种方法)-零度会员

如何在 Windows 11 中删除用户配置文件(3 种方法)

就像 Windows 10 一样,Windows 11 可以选择创建多个本地用户帐户,允许用户为使用计算机的每个用户创建单独的帐户。 在 techviral 上,我们已经分享了在 Windows 11 上添加本地用户帐户的分步...
admin的头像-零度会员admin
1.8W+2251
LittleBigMouse 一款跨屏多屏幕操作鼠标的开源软件-零度会员

LittleBigMouse 一款跨屏多屏幕操作鼠标的开源软件

Little Big Mouse 是一款专为 Windows 10 和 11 设计的开源工具,能够智能地调整多显示器间的 DPI 和物理尺寸差异,使鼠标在跨屏移动时保持精准对齐和流畅过渡,为用户提供更加自然的多屏操作体...
admin的头像-零度会员admin
1.6W+2564
采用 Flatpak 的 8 大 Linux 发行版-零度会员

采用 Flatpak 的 8 大 Linux 发行版

在由带有专用 COTS(商业现货)软件的高级操作系统主导的市场中,Linux 用户必须使用此类高级应用程序的开源变体。 在 Linux 上分发此类软件的一种与发行版无关的方式是 Flatpak。这就是为什么 ...
admin的头像-零度会员admin
1.6W+2251
Google Voice保号教程,永久免费使用谷歌的虚拟手机号!-零度会员

Google Voice保号教程,永久免费使用谷歌的虚拟手机号!

Google Voice的虚拟手机号如果长时间不去使用 会被谷歌收回的 所以Google voice的保号就很有必要! 保号教程很简单,只需要去IFTTT网站创建一个免费的任务即可 网站:https://ifttt.com 进入网...
Gminer 开源的挖矿软件!最受欢迎的挖矿程序-零度会员

Gminer 开源的挖矿软件!最受欢迎的挖矿程序

  Gminer 挖矿程序: 【点击下载】   Gminer特点: 佣金是连续收取的,而不是间隔收取的(就像大多数矿工一样),这对用户在 PPLNS 矿池上的盈利能力有积极影响 验证生成的 DAG,当 E...
美国新泽西惊现 “UFO”!真相究竟是外星人现身?还是军方黑科技?| 零度解说-零度会员