谷歌正式发布开源模型家族Gemma 4,包含4款不同尺寸,全部采用Apache 2.0许可证,允许自由商用、修改和分发。
4款核心模型与适用场景
- 31B Dense:质量最高,适合微调,量化版可运行于消费级GPU。
- 26B MoE(混合专家):总参数26B,推理仅激活3.8B,主打低延迟,适合Agent场景。
- E4B 与 E2B(边缘模型):面向手机和IoT设备,支持离线运行与音频输入,专为续航优化。
性能与能力
在Arena AI文本排行榜中,31B模型位列全球开源模型第三。核心能力涵盖:
- 多步推理与规划
- 原生函数调用与JSON结构化输出
- 代码生成、图像与视频理解
- 支持超过140种语言
- 边缘模型支持128K上下文,大模型最高支持256K
生态与部署
发布首日即获得Hugging Face、vLLM、llama.cpp等主流框架支持。开发者可通过Google AI Studio(31B/26B)和AI Edge Gallery(E4B/E2B)直接体验。E2B和E4B已与谷歌Pixel、高通、联发科联合优化,可部署于手机、树莓派等设备。