Omar Sanseviero von Google DeepMind gab am 24. Mai bekannt, dass Gemma 4 seit seiner Veröffentlichung am 2. April unter der Apache-2.0-Lizenz mittlerweile über 120 Millionen Mal heruntergeladen wurde. Er bezeichnete den Trend zu lokal laufenden KI-Modellen als „unglaublich“. Damit erhöht sich die Gesamtzahl aller Downloads der gesamten Gemma-Familie auf über 400 Millionen – inklusive mehr als 100.000 von der Community entwickelten Varianten auf Hugging Face. Gemma 4 ist in vier Größen erhältlich: E2B, E4B, ein 26-Milliarden-Parameter-Mixture-of-Experts-Modell sowie ein 31-Milliarden-Parameter-Dichtemodell. Die beiden kleinsten Varianten wurden gemeinsam mit Qualcomm und MediaTek entwickelt, um eine effiziente lokale Ausführung zu ermöglichen; sie benötigen bei einer 4-Bit-Quantisierung weniger als 1,5 GB Arbeitsspeicher.
Dieser Meilenstein wurde durch eine Feldvorführung von Google-Ingenieuren begleitet: Sie nutzten eine experimentelle Gemma-4-App in einem abgelegenen Gebiet ohne Mobilfunk- oder WLAN-Verbindung. Dabei testeten sie die Offline-Fähigkeiten hinsichtlich visueller Verarbeitung, mathematischer Problemlösung per Handschrift sowie Tool-Aufrufe – alles auf Pixel-Geräten in Kombination mit Prototyp-Brillen, ohne auch nur einen einzigen Serveraufruf. Google plant, die Modelle E2B und E4B als Basis für Gemini Nano 4 zu verwenden; dieses zukünftige System-KI-Modell für Android soll noch in diesem Jahr auf High-End-Geräten eingeführt werden. Mittlerweile läuft Gemini Nano bereits auf über 140 Millionen Android-Geräten. Durch seine Multimodalität, native Funktionsaufruf-Fähigkeit sowie Offline-Eigenschaften positioniert sich Gemma 4 direkt im Wettbewerb mit Apples Plattform für lokale KI-Anwendungen.