24 мая Омар Сансевьеро из Google DeepMind сообщил, что с момента своего выпуска 2 апреля модель Gemma 4 под лицензией Apache 2.0 была скачана более 120 миллионов раз. Он охарактеризовал тренд на развитие ИИ для работы непосредственно на устройствах как «бурный». Этот показатель дополняет общую статистику всей линейки Gemma: совокупное количество скачиваний всех версий превысило 400 миллионов, а число вариантов моделей, созданных сообществом и размещённых на платформе Hugging Face, перевалило за 100 000. Gemma 4 вышла в четырёх вариантах: E2B, E4B, модель типа Mixture-of-Experts с 26 миллиардами параметров и полноценная модель с 31 миллиардом параметров. Две наименьшие версии были разработаны совместно с компаниями Qualcomm и MediaTek для эффективной работы на устройствах: при квантовании до 4 бит они занимают менее 1,5 ГБ оперативной памяти.
Это достижение было продемонстрировано в ходе полевого эксперимента инженеров Google: экспериментальное приложение на базе Gemma 4 протестировали в отдалённой местности без сотовой связи и Wi-Fi. В рамках тестов проверялись возможности распознавания изображений в автономном режиме, решения математических задач по рукописным записям и вызова функций через интерфейс Pixel в сочетании с прототипом очков-дисплеев — всё это без единого обращения к серверу. Модели E2B и E4B послужили основой для создания Gemini Nano 4 — новой системной модели для Android, которая в этом году поступит на флагманские устройства; на данный момент Gemini Nano уже используется более чем на 140 миллионах Android-гаджетов. Благодаря мультимодальной архитектуре, встроенной поддержке вызова функций и возможности работы в офлайне Gemma 4 позиционируется как прямой конкурент экосистеме локального ИИ от Apple.