구글은 5월 19일 Google I/O 2026에서 Gemini 3.5 시리즈를 공개했으며, 첫 모델인 3.5 Flash가 즉시 전 세계에 출시됩니다. 구글 측에 따르면 이 모델은 에이전트 작업 및 코드 생성 분야에서 Gemini 3.1 Pro를 능가하며, Terminal-Bench 2.1(76.2%), GDPval-AA(1,656 Elo) 등 주요 에이전트 벤치마크와 멀티모달 이해력 테스트인 CharXiv Reasoning(84.2%)에서도 신기록을 달성했습니다. 초당 토큰 생성 속도는 다른 최첨단 모델의 4배에 달하고, 장기간 실행되는 에이전트 작업 비용도 경쟁 제품의 절반 미만입니다. Artificial Analysis 지수상에서는 ‘최첨단 지능 × 초고속 응답’ 사분면의 우측 상단에 위치합니다. 3.5 Flash는 현재 Gemini 앱, 구글 검색 AI 모드, Google AI Studio, Android Studio 및 기업용 Gemini Enterprise Agent Platform에서 사용할 수 있습니다. 더 강력한 플래그십 모델인 Gemini 3.5 Pro 역시 이미 구글 내부에서 활용 중이며, 6월에 외부에 공개될 예정입니다.
3.5 Flash 출시와 함께 구글은 두 가지 새로운 인프라도 선보였습니다. 첫째는 여러 하위 에이전트를 병렬로 배치해 대규모 장기 워크플로우를 처리할 수 있는 에이전트 중심 개발 플랫폼 ‘Google Antigravity’입니다. 구글은 두 개의 에이전트가 협업하여 6시간 만에 AlphaZero 논문을 읽고 실제로 플레이 가능한 게임까지 개발하는 과정을 시연했습니다. 둘째는 3.5 Flash를 기반으로 24시간 내내 사용자를 대신해 디지털 업무를 수행하는 개인용 AI 에이전트 ‘Gemini Spark’입니다. 이 서비스는 오늘부터 신뢰할 수 있는 테스터들에게 제공되며, 다음 주부터는 미국 지역의 Google AI Ultra 구독자들에게 베타 버전이 배포될 예정입니다. 상용화 측면에서는 Shopify가 병렬 하위 에이전트를 활용해 전 세계 판매자들의 성장을 예측하고 있으며, Macquarie 은행은 100페이지 이상의 문서를 분석해 고객 온보딩 속도를 높이는 데 이 모델을 활용하고 있습니다. 또한 Salesforce는 이를 Agentforce에 통합했으며, Ramp는 송장의 멀티모달 OCR 인식에 활용하고 있습니다. 구글 측은 Gemini 3.5 시리즈가 Frontier Safety Framework 하에서 개발되었으며, 응답 전 모델의 내부 추론 과정을 점검할 수 있는 설명 가능성 도구도 도입했다고 밝혔습니다.