Google DeepMind 推出 Gemma 4 12B，16 GB 内存笔记本可本地运行

ref · 4 Junio, 2026 03:24

Google DeepMind 于 6 月 3 日发布 Gemma 4 12B 开放权重模型，参数量约 120 亿，采用 Apache 2.0 许可证，最低只需 16 GB 显存或统一内存即可在普通笔记本上本地运行。该模型最大亮点是无编码器的"统一"架构——视觉与音频输入直接注入语言模型主干，无需独立的多模态编码器，是 Google 首款支持原生音频输入的中型模型。Google 称其基准性能已接近更大的 26B MoE 模型，同时内存占用不到后者的一半。

此次发布时，Gemma 4 系列下载量已突破 1.5 亿次。模型权重已上线 Hugging Face 与 Kaggle，原生支持 vLLM、SGLang、MLX、llama.cpp 等主流推理框架，也可通过 LM Studio 和 Ollama 一键运行。Google 同步开源了 Gemma Skills 技能仓库，专为基于 Gemma 构建的 AI Agent 提供标准化工具集。此外，Google AI Edge Gallery macOS 应用同日上线，用户可直接在本地体验多模态智能体工作流。

Google The Keyword

Tema	Respuestas	Vistas
Gemma 4 tops 120 million downloads since launch as offline demo shows on-device vision and math reasoning on Pixel with no connectivity 常规 ai , google , gemma-4 , on-device-ai , 开源	15	24 Mayo 2026
谷歌发布 Gemini 3.5 Flash，速度 4 倍于同类前沿模型常规 ai , gemini , google , 大模型 , google-io	5	20 Mayo 2026
谷歌 I/O 发布 Gemini Omni，任意输入生成并对话编辑视频常规 ai , gemini , google , google-io , 视频生成	4	20 Mayo 2026
Gemini Spark 正式向美国所有 AI Ultra 订阅者开放，月费 100 美元起，可后台持续执行跨应用任务常规 gemini , google , spark	4	31 Mayo 2026
谷歌 AI Mode 月活破 10 亿，搜索框 25 年最大升级常规 google , google-io , 搜索 , ai-mode , agent	3	20 Mayo 2026

Google DeepMind 推出 Gemma 4 12B，16 GB 内存笔记本可本地运行

Temas relacionados