谷歌发布 Gemini 3.5 Flash,速度 4 倍于同类前沿模型

谷歌 5 月 19 日在 Google I/O 2026 上发布 Gemini 3.5 系列,首发型号 3.5 Flash 即日起向全球开放。官方称其在代理任务与代码生成领域超越 Gemini 3.1 Pro,在 Terminal-Bench 2.1(76.2%)、GDPval-AA(1,656 Elo)等核心 Agent 基准及多模态理解测试 CharXiv Reasoning(84.2%)上均创下新高;每秒输出 Token 速度是其他前沿模型的 4 倍,长程 Agentic 任务运行成本不足竞品的一半,在 Artificial Analysis 指数中位于"前沿智能 × 极速响应"象限右上角。3.5 Flash 已上线 Gemini 应用、谷歌搜索 AI Mode、Google AI Studio、Android Studio 及企业版 Gemini Enterprise Agent Platform。更大规模的旗舰型号 Gemini 3.5 Pro 已在谷歌内部投入使用,计划 6 月对外推出。

配合 3.5 Flash 发布,谷歌还推出两项新基础设施。其一是代理优先开发平台 Google Antigravity,支持将多个子 Agent 并行部署以处理大规模长程工作流,谷歌演示了双 Agent 协作在六小时内阅读 AlphaZero 论文并完成可玩游戏的开发。其二是个人 AI Agent Gemini Spark,以 3.5 Flash 为底座、24 小时全天候代替用户执行数字任务,今日起向受信任测试者开放,下周向美国区 Google AI Ultra 订阅用户推送 Beta 版。商业落地方面,Shopify 已用并行子 Agent 进行全球商家增长预测,Macquarie 银行借助模型对百页以上文件的推理来加速客户入网,Salesforce 将其集成至 Agentforce,Ramp 则用于发票多模态 OCR 识别。谷歌表示,Gemini 3.5 系列已在 Frontier Safety Framework 框架下完成开发,并引入可解释性工具在响应前检查模型内部推理过程。

Google Blog