구글이 Gemini 3.5 Flash를 출시했으며, 속도는 기존 최첨단 모델들보다 4배 빠릅니다.

ref · 5월 20, 2026, 1:16오전

구글은 5월 19일 Google I/O 2026에서 Gemini 3.5 시리즈를 공개했으며, 첫 모델인 3.5 Flash가 즉시 전 세계에 출시됩니다. 구글 측에 따르면 이 모델은 에이전트 작업 및 코드 생성 분야에서 Gemini 3.1 Pro를 능가하며, Terminal-Bench 2.1(76.2%), GDPval-AA(1,656 Elo) 등 주요 에이전트 벤치마크와 멀티모달 이해력 테스트인 CharXiv Reasoning(84.2%)에서도 신기록을 달성했습니다. 초당 토큰 생성 속도는 다른 최첨단 모델의 4배에 달하고, 장기간 실행되는 에이전트 작업 비용도 경쟁 제품의 절반 미만입니다. Artificial Analysis 지수상에서는 ‘최첨단 지능 × 초고속 응답’ 사분면의 우측 상단에 위치합니다. 3.5 Flash는 현재 Gemini 앱, 구글 검색 AI 모드, Google AI Studio, Android Studio 및 기업용 Gemini Enterprise Agent Platform에서 사용할 수 있습니다. 더 강력한 플래그십 모델인 Gemini 3.5 Pro 역시 이미 구글 내부에서 활용 중이며, 6월에 외부에 공개될 예정입니다.

3.5 Flash 출시와 함께 구글은 두 가지 새로운 인프라도 선보였습니다. 첫째는 여러 하위 에이전트를 병렬로 배치해 대규모 장기 워크플로우를 처리할 수 있는 에이전트 중심 개발 플랫폼 ‘Google Antigravity’입니다. 구글은 두 개의 에이전트가 협업하여 6시간 만에 AlphaZero 논문을 읽고 실제로 플레이 가능한 게임까지 개발하는 과정을 시연했습니다. 둘째는 3.5 Flash를 기반으로 24시간 내내 사용자를 대신해 디지털 업무를 수행하는 개인용 AI 에이전트 ‘Gemini Spark’입니다. 이 서비스는 오늘부터 신뢰할 수 있는 테스터들에게 제공되며, 다음 주부터는 미국 지역의 Google AI Ultra 구독자들에게 베타 버전이 배포될 예정입니다. 상용화 측면에서는 Shopify가 병렬 하위 에이전트를 활용해 전 세계 판매자들의 성장을 예측하고 있으며, Macquarie 은행은 100페이지 이상의 문서를 분석해 고객 온보딩 속도를 높이는 데 이 모델을 활용하고 있습니다. 또한 Salesforce는 이를 Agentforce에 통합했으며, Ramp는 송장의 멀티모달 OCR 인식에 활용하고 있습니다. 구글 측은 Gemini 3.5 시리즈가 Frontier Safety Framework 하에서 개발되었으며, 응답 전 모델의 내부 추론 과정을 점검할 수 있는 설명 가능성 도구도 도입했다고 밝혔습니다.

Google 블로그

글	댓글	조회수
谷歌 AI Mode 月活破 10 亿，搜索框 25 年最大升级常规 google , google-io , 搜索 , ai-mode , agent	3	5월 20, 2026
Google Antigravity adds Gemini 3.5 Flash Low tier, cuts token usage by 45% for simple tasks 常规 antigravity , gemini , google , token-optimization	5	5월 25, 2026
谷歌 I/O 发布 Gemini Omni，任意输入生成并对话编辑视频常规 ai , gemini , google , google-io , 视频生成	4	5월 20, 2026
Google Antigravity 紧急将全付费档 Gemini 配额提升 3 倍并重置本周用量常规限速 , google , gemini , antigravity , ide	3	5월 21, 2026
谷歌 Gemini CLI 将于 6 月 18 日停服，Antigravity CLI 今日发布常规 gemini , google , 开发者工具 , antigravity , cli	5	5월 20, 2026

구글이 Gemini 3.5 Flash를 출시했으며, 속도는 기존 최첨단 모델들보다 4배 빠릅니다.

Related topics