Google Gemma 4：从泄露到爆火的全景深度调研

Google Gemma 4 于 2026 年 4 月 2 日正式发布，是 Gemma 系列迄今最大的一次代际跃升。 这一代首次采用 Apache 2.0 开源许可证（此前 Gemma 系列均使用限制性许可），提供 4 个模型尺寸（E2B、E4B、26B MoE、31B Dense），原生支持文本、图像、视频和音频四种模态，上下文窗口最大扩展至 256K tokens。在 AIME 2026 数学基准上，31B 模型从 Gemma 3 的 20.8% 飙升至 89.2%，编程能力（LiveCodeBench）从 29.1% 跃至 80.0%，标志着 Gemma 从"可用"进入了"可与顶级大模型竞争"的新阶段。发布仅 48 小时内 Ollama 拉取量超 20.7 万次，截至 4 月 10 日累计下载量已突破 4 亿次。

Gemma 模型家族演进时间线

Gemma 系列的完整演进时间线

理解 Gemma 4 的意义，需要先回溯整个系列的发展脉络。Google 自 2024 年初开始以约半年至一年的节奏迭代 Gemma 系列，每一代都在架构、模态和开放程度上进行显著升级。

Gemma 1（2024 年 2 月 21 日） 是 Google 首个面向开发者的开放权重模型系列，提供 2B 和 7B 两个参数规模，采用与 Gemini 相同的技术基底。两个月后的 4 月 9 日，专注代码生成的 CodeGemma 发布（2B/7B）。

Gemma 2（2024 年 6 月 27 日） 在 Google I/O 2024（5 月 14 日）上预告后正式发布，参数规模扩展至 9B 和 27B，引入分组查询注意力（GQA）和 8 万 token 上下文窗口。7 月 31 日补充了 2B 变体和安全评估模型 ShieldGemma。同年晚些时候，视觉语言模型 PaliGemma 及其升级版 PaliGemma 2 相继发布。

Gemma 3（2025 年 3 月 12 日） 实现了多个关键突破：首次引入多模态能力（文本+图像输入），上下文窗口从 8K 大幅提升至 128K tokens，支持 140+ 种语言，提供 1B、4B、12B、27B 四个尺寸。在 LMArena 上达到 1338 Elo，性能超越许多更大的模型。同年 5 月 22 日的 Google I/O 2025 上，Google 发布了面向边缘设备优化的 Gemma 3n（E2B/E4B），引入了后来在 Gemma 4 中发挥重要作用的 Per-Layer Embeddings（PLE） 技术创新。

世代	发布日期	距上一代间隔	关键突破
Gemma 1	2024-02-21	—	首个开放权重模型
Gemma 2	2024-06-27	~4 个月	27B 参数、GQA
Gemma 3	2025-03-12	~8.5 个月	多模态、128K 上下文
Gemma 3n	2025-05-22	~2 个月（子版本）	边缘设备优化、PLE
Gemma 4	2026-04-02	~12.5 个月	Apache 2.0、MoE、256K、音频

模型	架构	总参数	有效/活跃参数	层数	上下文窗口	模态
E2B	Dense + PLE	5.1B	2.3B	35	128K	文本、图像、视频、音频
E4B	Dense + PLE	8B	4.5B	42	128K	文本、图像、视频、音频
26B A4B	MoE	25.2B	3.8B	30	256K	文本、图像、视频
31B	Dense	30.7B	30.7B	60	256K	文本、图像、视频

基准测试	31B	26B A4B	E4B	E2B	Gemma 3 27B
MMLU Pro	85.2%	82.6%	69.4%	60.0%	67.6%
AIME 2026	89.2%	88.3%	42.5%	37.5%	20.8%
GPQA Diamond	84.3%	82.3%	58.6%	43.4%	42.4%
LiveCodeBench v6	80.0%	77.1%	52.0%	44.0%	29.1%
Codeforces ELO	2150	1718	940	633	110
MMMU Pro（视觉）	76.9%	73.8%	52.6%	44.2%	49.7%
MATH-Vision	85.6%	82.4%	59.5%	52.4%	46.0%
τ2-bench（Agent）	76.9%	68.2%	42.2%	24.5%	16.2%
Arena AI 文本 Elo	1452（#3）	1441（#6）	—	—	1365

Google Gemma 4：从泄露到爆火的全景深度调研

Google Gemma 4：从泄露到爆火的全景深度调研

Gemma 系列的完整演进时间线

"significant-otter"泄露与发布前夜的信号

四个模型的架构设计与技术规格

基准测试表现：一次代际级的性能飞跃

全平台上线时间线：史无前例的首日生态覆盖

社区热度爆发与多平台讨论图景

赞誉与批评：社区评价的两面

结论：Gemma 4 重新定义了开放模型的竞争格局

作者

分类

更多文章

Gemma 4 vs Qwen 3.6-Plus: The Real Differences That Matter (2026)

OpenClaw + Gemma 4: Build a Free Local AI Agent in 5 Minutes (2026 Guide)

Which Gemma 4 Model Runs on YOUR Device? The Complete Guide for iPhone, Android & Mac Mini