Gemini 3 Flash发布：免费又快，实测超越Pro，谷歌AI迈入“几乎零等待”时代-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

谷歌又一次把大模型的性能与成本边界推得更远。今天，正式推出全新轻量级模型 Gemini3Flash——在保持极低延迟的同时，响应速度达到前代的3倍，几乎“无等待”；并且在多项硬核基准上反超同代旗舰 Gemini3Pro，成为首个在同场对比里“小体量胜大杯”的 Flash 系列。更出乎意料的是，这一高端性能版本面向全球免费开放，已默认集成于 Gemini App、AI Studio、Google Antigravity 以及 CLI 工具。

Gemini3Flash的成绩可以说是“降维式碾压”:

– 在代码修复权威基准 SWE-bench 上，取得 78% 分数，略高于 Gemini3Pro 的 76.2%;

– 在博士级推理评测 GPQA Diamond 中拿到 90.4%;

– 在极难的综合测试 Humanity’s Last Exam（无工具模式）中达到 33.7%，明显优于前代旗舰 Gemini2.5Pro;

– 在 LMArena 文本能力榜单上升至全球第三。

这背后来自谷歌对模型架构的深度打磨：在压低推理成本的同时，通过知识蒸馏、推理路径压缩与多模态对齐等方法，让小模型也能具备接近大模型的逻辑深度。无论上传图片还是视频，Flash 都能在数秒内完成理解并给出可执行方案——从定位电路故障到制定旅行路线，响应快得像闪电。

为了覆盖不同使用场景，新版 Gemini App 提供三种交互档位:

– 极速模式：默认启用 Gemini3Flash，适合日常问答；

– 思考模式：打开 Flash 的深度推理链，处理复杂逻辑；

– 专业模式：保留 Gemini3Pro，聚焦高难度数学与编程任务。

这意味着，普通用户不必付费，也能享受过去只在高阶订阅中提供的智能体验。你在 Google 搜索里提出的复杂问题，背后已由融合顶级推理能力的 AI 引擎驱动。

市场反馈也给出了强力背书：Gemini App 月活从一个季度内的 4.5 亿跃升至 6.5 亿，开发者规模超过 1300 万，API 调用量同比增长 3 倍。随着 Flash 加入，Gemini3 形成清晰产品梯队——Deep Think（深度推理）、Pro（专业攻坚）、Flash（普惠极速）——面向从大众用户到科研与开发者的全谱系需求。

当免费款开始跑赢付费旗舰，AI 的竞争已不仅是参数规模的较量，更是效率、体验与普惠的综合比拼。谷歌用 Gemini3Flash 表明：下一代 AI，不止要聪明，更要快、省、人人可用。