Gemma 4 — 开源多模态 AI 平台
文本 · 图像 · 音频 | Google 最强开源模型 | 免费在线使用
在线体验 · Gemma 4 27B
生成耗时 0.8s · 27B MoE
认识 Gemma 4
你的硬件能跑哪个 Gemma 4 模型?
选择你的设备和配置,找到最适合你的 Mac、NVIDIA 显卡、AMD 显卡或 CPU 的 Gemma 4 模型。
速度
~60–80 tok/s
磁盘
5.0 GB
内存占用
~6 GB
模态
文本 + 图像
ollama run gemma4:e4b-it-q8_027B Q4 possible for short conversations, but E4B Q8 better at full context.
硬件兼容性
| 模型 | 最低显存 / 内存 | 适用场景 | 安装命令 |
|---|---|---|---|
| Gemma 4 E2B | 2 GB | 手机、仅 CPU、嵌入式设备 | ollama run gemma4:e2b |
| Gemma 4 E4B | 3 GB | 8–16 GB 设备、大部分笔记本 | ollama run gemma4:e4b |
| Gemma 4 27B | 15 GB | 24 GB 以上 Mac 或显卡,最佳 MoE 平衡 | ollama run gemma4:27b-it-q4_K_M |
| Gemma 4 31B | 18 GB | 48 GB 以上 Mac 或 32 GB 以上显卡,最高质量 | ollama run gemma4:31b-it-q4_K_M |
三种模态,一个模型
Gemma 4 vs Qwen 3.5 · 社区评测
维度
Gemma 4
Qwen 3.5
思考效率
✓ 优势token 更高效
⚠ 一般容易过度思考
编程
⚠ 一般
✓ 优势
多模态
✓ 优势文本 + 图像 + 音频
✗ 不支持仅文本
欧洲语言
✓ 优势
⚠ 一般
中文
⚠ 一般
✓ 优势
长上下文
✓ 优势256K
⚠ 一般128K
工具生态
⚠ 一般llama.cpp 有 bug
✓ 优势
许可证
✓ Apache 2.0
✓ Apache 2.0
AI 工具
本地部署
| 模型 | 显存(Q4_K_M) |
|---|---|
| Gemma 4 E2B | ~1.5 GB |
| Gemma 4 E4B | ~2.8 GB |
| Gemma 4 27B MoE | ~15 GB |
| Gemma 4 31B Dense | ~18 GB |
terminal
ollama run gemma4:27b-it-q4_K_M█常见问题
Gemma 4 是从 Gemini 3 架构蒸馏而来,由 Google 作为开源模型发布。Gemini 是闭源 API 产品,而 Gemma 4 可以本地部署,也可以在 Gemma4 Tools 上免费在线使用。
完全免费。Gemma4 Tools 基于 Google Gemini API 免费层,无需注册、无需付费即可体验所有 Gemma 4 功能。
所有数据通过 Google 官方 Gemma 4 API 处理。Gemma4 Tools 不存储您上传的任何文件或对话内容——所有数据实时处理后即时丢弃。
支持,Gemma 4 支持 140+ 种语言,包括中文。不过 Gemma 4 的中文能力略逊于 Qwen 系列——建议两个模型都试试,找到最适合你的。
Gemma 4 27B MoE 推理速度更快(仅约 40 亿参数激活),适合日常对话和轻量任务。Gemma 4 31B Dense 综合质量更高,适合复杂推理和深度分析。
推荐使用 Ollama 一键部署——运行 `ollama run gemma4:27b-it-q4_K_M` 即可在本地启动 Gemma 4。也可以从 HuggingFace 下载 GGUF 格式的 Gemma 4 模型手动配置。显存需求请参考上方部署指南。