Gemma 4 — 开源多模态 AI 平台

文本 · 图像 · 音频 | Google 最强开源模型 | 免费在线使用

免费试用 Gemma 4 →

了解更多 ↓

在线体验 · Gemma 4 27B

生成耗时 0.8s · 27B MoE

认识 Gemma 4

Gemma 4 E2B

20 亿参数 · 文本 + 图像

手机和嵌入式设备

试用此模型 →

Gemma 4 E4B

40 亿参数 · 文本 + 图像

笔记本和轻量推理

试用此模型 →

Gemma 4 27B

270 亿 MoE · 文本 + 图像 + 音频

桌面服务器和多模态任务

试用此模型 →

Gemma 4 31B

你的硬件能跑哪个 Gemma 4 模型？

选择你的设备和配置，找到最适合你的 Mac、NVIDIA 显卡、AMD 显卡或 CPU 的 Gemma 4 模型。

设备

芯片 + 内存

Gemma 4 E4B

Q8_0最佳推荐

速度

~60–80 tok/s

磁盘

5.0 GB

内存占用

~6 GB

模态

文本 + 图像

ollama run gemma4:e4b-it-q8_0

27B Q4 possible for short conversations, but E4B Q8 better at full context.

硬件兼容性

模型	最低显存 / 内存	适用场景	安装命令
Gemma 4 E2B	2 GB	手机、仅 CPU、嵌入式设备	`ollama run gemma4:e2b`
Gemma 4 E4B	3 GB	8–16 GB 设备、大部分笔记本	`ollama run gemma4:e4b`
Gemma 4 27B	15 GB	24 GB 以上 Mac 或显卡，最佳 MoE 平衡	`ollama run gemma4:27b-it-q4_K_M`
Gemma 4 31B	18 GB	48 GB 以上 Mac 或 32 GB 以上显卡，最高质量	`ollama run gemma4:31b-it-q4_K_M`

没有显卡？免费在线试用 Gemma 4 →

三种模态，一个模型

📝

文本

文本理解

流畅对话、长文档分析和代码生成——Gemma 4 支持最高 256K 上下文窗口

与 Gemma 4 对话 →

🖼️

视觉

图像理解

上传任意图片，即时获取描述、视觉问答和多图对比，由 Gemma 4 驱动

上传图片 →

🎧

音频

音频理解

原生音频输入，支持语音转文字、会议摘要和内容提取，由 Gemma 4 驱动

上传音频 →

免费试用所有 Gemma 4 工具——无需注册

基于 Google Gemini API 免费层开始使用 Gemma 4 →

Gemma 4 vs Qwen 3.5 · 社区评测

维度

Gemma 4

Qwen 3.5

思考效率

✓ 优势token 更高效

⚠ 一般容易过度思考

编程

⚠ 一般

✓ 优势

多模态

✓ 优势文本 + 图像 + 音频

✗ 不支持仅文本

欧洲语言

✓ 优势

⚠ 一般

中文

⚠ 一般

✓ 优势

长上下文

✓ 优势256K

⚠ 一般128K

工具生态

⚠ 一般llama.cpp 有 bug

✓ 优势

许可证

✓ Apache 2.0

不确定？自己试试 Gemma 4 →

AI 工具

已上线

💬

多模态对话

与 Gemma 4 自由对话——上传图片和音频，体验最强开源多模态 AI

上传 PDF 或文本，让 Gemma 4 提取关键信息

已上线

🌐

翻译助手

使用 Gemma 4 翻译 140+ 种语言

已上线

🎙️

音频摘要

上传音频，Gemma 4 生成会议记录和摘要

本地部署

模型	显存（Q4_K_M）
Gemma 4 E2B	~1.5 GB
Gemma 4 E4B	~2.8 GB
Gemma 4 27B MoE	~15 GB
Gemma 4 31B Dense	~18 GB

terminal

ollama run gemma4:27b-it-q4_K_M█

HuggingFace Kaggle

没有显卡？免费在线试用 Gemma 4 →

常见问题

Gemma 4 是从 Gemini 3 架构蒸馏而来，由 Google 作为开源模型发布。Gemini 是闭源 API 产品，而 Gemma 4 可以本地部署，也可以在 Gemma4 Tools 上免费在线使用。

完全免费。Gemma4 Tools 基于 Google Gemini API 免费层，无需注册、无需付费即可体验所有 Gemma 4 功能。

所有数据通过 Google 官方 Gemma 4 API 处理。Gemma4 Tools 不存储您上传的任何文件或对话内容——所有数据实时处理后即时丢弃。

支持，Gemma 4 支持 140+ 种语言，包括中文。不过 Gemma 4 的中文能力略逊于 Qwen 系列——建议两个模型都试试，找到最适合你的。

Gemma 4 27B MoE 推理速度更快（仅约 40 亿参数激活），适合日常对话和轻量任务。Gemma 4 31B Dense 综合质量更高，适合复杂推理和深度分析。

推荐使用 Ollama 一键部署——运行 `ollama run gemma4:27b-it-q4_K_M` 即可在本地启动 Gemma 4。也可以从 HuggingFace 下载 GGUF 格式的 Gemma 4 模型手动配置。显存需求请参考上方部署指南。

认识 Gemma 4

Gemma 4 E2B

20 亿参数 · 文本 + 图像

手机和嵌入式设备

试用此模型 →

Gemma 4 E4B

40 亿参数 · 文本 + 图像

笔记本和轻量推理

试用此模型 →

Gemma 4 27B

270 亿 MoE · 文本 + 图像 + 音频

桌面服务器和多模态任务

试用此模型 →

Gemma 4 31B

Gemma 4 E4B

Q8_0最佳推荐

速度

~60–80 tok/s

磁盘

5.0 GB

内存占用

~6 GB

模态

文本 + 图像

ollama run gemma4:e4b-it-q8_0

27B Q4 possible for short conversations, but E4B Q8 better at full context.

硬件兼容性

模型	最低显存 / 内存	适用场景	安装命令
Gemma 4 E2B	2 GB	手机、仅 CPU、嵌入式设备	`ollama run gemma4:e2b`
Gemma 4 E4B	3 GB	8–16 GB 设备、大部分笔记本	`ollama run gemma4:e4b`
Gemma 4 27B	15 GB	24 GB 以上 Mac 或显卡，最佳 MoE 平衡	`ollama run gemma4:27b-it-q4_K_M`
Gemma 4 31B	18 GB	48 GB 以上 Mac 或 32 GB 以上显卡，最高质量	`ollama run gemma4:31b-it-q4_K_M`

三种模态，一个模型

📝

文本

文本理解

流畅对话、长文档分析和代码生成——Gemma 4 支持最高 256K 上下文窗口

与 Gemma 4 对话 →

🖼️

视觉

图像理解

上传任意图片，即时获取描述、视觉问答和多图对比，由 Gemma 4 驱动

上传图片 →

🎧

音频

音频理解

原生音频输入，支持语音转文字、会议摘要和内容提取，由 Gemma 4 驱动

上传音频 →

Gemma 4 vs Qwen 3.5 · 社区评测

维度

Gemma 4

Qwen 3.5

思考效率

✓ 优势token 更高效

⚠ 一般容易过度思考

编程

⚠ 一般

✓ 优势

多模态

✓ 优势文本 + 图像 + 音频

✗ 不支持仅文本

欧洲语言

✓ 优势

⚠ 一般

中文

⚠ 一般

✓ 优势

长上下文

✓ 优势256K

⚠ 一般128K

工具生态

⚠ 一般llama.cpp 有 bug

✓ 优势

许可证

✓ Apache 2.0

不确定？自己试试 Gemma 4 →

模型

显存（Q4_K_M）

Gemma 4 E2B

~1.5 GB

Gemma 4 E4B

~2.8 GB

Gemma 4 27B MoE

~15 GB

Gemma 4 31B Dense

~18 GB

常见问题

Gemma 4 是从 Gemini 3 架构蒸馏而来，由 Google 作为开源模型发布。Gemini 是闭源 API 产品，而 Gemma 4 可以本地部署，也可以在 Gemma4 Tools 上免费在线使用。

完全免费。Gemma4 Tools 基于 Google Gemini API 免费层，无需注册、无需付费即可体验所有 Gemma 4 功能。

所有数据通过 Google 官方 Gemma 4 API 处理。Gemma4 Tools 不存储您上传的任何文件或对话内容——所有数据实时处理后即时丢弃。

支持，Gemma 4 支持 140+ 种语言，包括中文。不过 Gemma 4 的中文能力略逊于 Qwen 系列——建议两个模型都试试，找到最适合你的。

Gemma 4 27B MoE 推理速度更快（仅约 40 亿参数激活），适合日常对话和轻量任务。Gemma 4 31B Dense 综合质量更高，适合复杂推理和深度分析。