谷歌 Gemma 3 发布:更强大、更智能的多模态 AI,本地轻松部署使用!

Gemma 3 被谷歌称为目前最强的开源视觉模型之一。 该模型支持超过35种语言,能够分析文本、图像和短视频。值得注意的是,Gemma 3 的视觉编码器经过升级,支持高分辨率和非方形图像,并引入了 ShieldGemma 2 图像安全分类器,用于过滤被分类为性暗示、危险或暴力的内容。这些特性使得 Gemma 3 成为当前最强大的开源视觉模型之一。

图片[1]-谷歌 Gemma 3 发布:更强大、更智能的多模态 AI,本地轻松部署使用!-零度博客

此图表按 Chatbot Arena Elo 得分对 AI 模型进行排名;得分越高(数字越大),表示用户偏好越高。点表示估计的 NVIDIA H100 GPU 要求。Gemma 3 27B 排名靠前,只需要一个 GPU,而其他模型则需要多达 32 个。

最新的 Gemma 3 多模态开源模型新功能

  • 使用世界上最好的单加速器模型进行构建: Gemma 3 以其尺寸提供最先进的性能,在 LMArena 排行榜的初步人类偏好评估中胜过 Llama3-405B、DeepSeek-V3 和 o3-mini。这可以帮助您创建可安装在单个 GPU 或 TPU 主机上的引人入胜的用户体验。
  • 以 140 种语言走向全球:构建使用客户语言的应用程序。Gemma 3 提供对超过 35 种语言的开箱即用支持和对超过 140 种语言的预训练支持。
  • 打造具备高级文本和视觉推理能力的AI:轻松构建分析图片、文本、短视频等应用,开启交互智能化新可能1
  • 使用扩展的上下文窗口处理复杂任务: Gemma 3 提供 128k 令牌上下文窗口,让您的应用程序处理和理解大量信息。
  • 使用函数调用创建 AI 驱动的工作流程: Gemma 3 支持函数调用和结构化输出,以帮助您自动执行任务并构建代理体验。
  • 通过量化模型更快地实现高性能: Gemma 3 引入了官方量化版本,减少了模型大小和计算要求,同时保持了高精度。
 

本地安装,单显卡可以选择1b,4b,12b,27b,推荐选择27b,因为Gemma 3 27B 处于帕累托最佳点

图片[2]-谷歌 Gemma 3 发布:更强大、更智能的多模态 AI,本地轻松部署使用!-零度博客

预先训练 指令调整 多式联运 多种语言 输入上下文窗口
gemma-3-1b-pt gemma-3-1b-it 英语 32千
Gemma-3-4b-pt gemma-3-4b-it +140 种语言 128千
gemma-3-12b-pt gemma-3-12b-it +140 种语言 128千
gemma-3-27b-pt gemma-3-27b-it +140 种语言 128千

对于 1B 版本,输入上下文窗口长度已从 Gemma 2 的 8k 增加到32k ,对于其他所有版本,则增加到 128k。与其他 VLM(视觉语言模型)一样,Gemma 3 会根据用户输入生成文本,这些文本可能由文本组成,也可能由图像组成。示例用途包括问答、分析图像内容、总结文档等。

本地部署Gemma 3开源大模型:

1、下载官方 Ollama 【点击前往】 ,并通过下方的安装命令执行下载:

普通用户建议选择4b和12b,显卡好的可以上27b 

ollama run gemma3:1b
ollama run gemma3:4b
ollama run gemma3:12b
ollama run gemma3:27b

2、通过Chrome插件调用本地Gemma 3视觉大模型【点击下载

图片[3]-谷歌 Gemma 3 发布:更强大、更智能的多模态 AI,本地轻松部署使用!-零度博客

就可以愉快的使用了

图片[4]-谷歌 Gemma 3 发布:更强大、更智能的多模态 AI,本地轻松部署使用!-零度博客可以很好的对图片进行识别:

图片[5]-谷歌 Gemma 3 发布:更强大、更智能的多模态 AI,本地轻松部署使用!-零度博客

 

 

当然你可以使用Google AI Studio 对短视频进行分析,支持上传和链接

 

Google AI Studio :【点击前往

 

afbbc931f520250315153635

 

THE END
喜欢就支持一下吧
点赞1381 分享
相关推荐
西部数据被黑客入侵!10TB 用户数据遭窃-零度博客

西部数据被黑客入侵!10TB 用户数据遭窃

  在确认黑客在三月份的网络攻击中窃取了敏感的个人信息后,西部数据已将其商店下线并向客户发送数据泄露通知。 该公司在周五下午晚些时候通过电子邮件发送了数据泄露通知,警告说客户的数...
admin的头像-零度博客admin
1.2W+6539
爆高危漏洞! Chrome、Edge 浏览器紧急发布:已证明被黑客利用的零日漏洞修复 | 零度解说-零度博客
DeOldify 一款可以给老旧照片上色的免费开源工具-零度博客

DeOldify 一款可以给老旧照片上色的免费开源工具

  快速入门:使用开源 DeOldify(免费!)为图像着色的最简单方法在这里:DeOldify Image Colorization on DeepAI 桌面:想要在 Windows 桌面上为照片运行开源 DeOldify?ColorfulSoft 在...
admin的头像-零度博客admin
1.3W+6539
免费在线看电影的十大最佳平台!-零度博客

免费在线看电影的十大最佳平台!

1.Vudu: https://www.vudu.com/ 2.看看TV: https://www.wekan.tv/ (仅限在加拿大和澳洲地区使用) 3.Tubi: https://tubitv.com/ 4.Bigdramas: https://bigdramas.org/ 5.Popcornflix: htt...
admin的头像-零度博客admin
1.7W+2251
如何破解 WiFi 密码?保姆级的教程,包教包会!-零度博客
赶紧更改!Telegram 被曝高危漏洞! 立即禁用电报这个功能才能自保 | 零度解说-零度博客

赶紧更改!Telegram 被曝高危漏洞! 立即禁用电报这个功能才能自保 | 零度解说

https://youtu.be/R11vGiDXLTg ============ Telegram 最新版下载:https://www.lingdu80.com/12060.html
Webtorrent 免费开源,且支持“边下边播”的BT种子下载工具!-零度博客

Webtorrent 免费开源,且支持“边下边播”的BT种子下载工具!

Webtorrent官方网站:https://webtorrent.io/desktop/ 适用于 Mac、Windows 和 Linux 的流式 Torrent 客户端 获取 WebTorrent 桌面 WebTorrent Desktop 用于流式传输种子。无论是来自Internet A...
文字转语音、语音转文字! 这几种方法你最好要知道-零度博客

文字转语音、语音转文字! 这几种方法你最好要知道

1.Whisper :开源项目 【官方下载】或 【备用下载】2.ggml-medium 语音模型: 【点击下载】3.CPU版的Whisper:【开源项目】或 【备用下载】
admin的头像-零度博客admin
5.9W+1707
【软件推荐】12款(吊打付费) 超好用的免费软件-零度博客

【软件推荐】12款(吊打付费) 超好用的免费软件

1.LKY Office Tools 一款免费开源的office软件一键免费部署工具,自动化 下载、安装、激活 Office 的利器!绿色、开源、安全、无毒 【Github开源项目】   2.VLC视频播放器 目前最强的全功...
admin的头像-零度博客admin
4.2W+3258