Google DeepMind 推出 Gemma 4 12B,16 GB 内存笔记本可本地运行

Google DeepMind 于 6 月 3 日发布 Gemma 4 12B 开放权重模型,参数量约 120 亿,采用 Apache 2.0 许可证,最低只需 16 GB 显存或统一内存即可在普通笔记本上本地运行。该模型最大亮点是无编码器的"统一"架构——视觉与音频输入直接注入语言模型主干,无需独立的多模态编码器,是 Google 首款支持原生音频输入的中型模型。Google 称其基准性能已接近更大的 26B MoE 模型,同时内存占用不到后者的一半。

此次发布时,Gemma 4 系列下载量已突破 1.5 亿次。模型权重已上线 Hugging Face 与 Kaggle,原生支持 vLLM、SGLang、MLX、llama.cpp 等主流推理框架,也可通过 LM Studio 和 Ollama 一键运行。Google 同步开源了 Gemma Skills 技能仓库,专为基于 Gemma 构建的 AI Agent 提供标准化工具集。此外,Google AI Edge Gallery macOS 应用同日上线,用户可直接在本地体验多模态智能体工作流。

Google The Keyword