Gemini 3 Flash发布：免费开放、响应飞快、智力超越Pro，谷歌AI迈入“零延迟”新阶段-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

谷歌再次把大模型的性能与成本边界向前推了一步。今天，官方上线全新轻量模型 Gemini3Flash——在保证接近“零延迟”的前提下，响应速度比上代快约三倍；更在多项高难度基准上超越同代旗舰 Gemini3Pro，成为史上首个同期对比中“轻量反超旗舰”的 Flash 型号。更出乎意料的是，这一顶尖版本面向全球免费开放，并已默认接入 Gemini App、AI Studio、Google Antigravity 与 CLI 工具。

Gemini3Flash的表现可谓一次“降维打击”:

– 在代码修复权威榜单 SWE-bench 上，以 78% 的成绩略高于 Gemini3Pro（76.2%）;

– 在博士级推理集 GPQA Diamond 上取得 90.4% 的高分;

– 在高难综合评测 Humanity’s Last Exam（无工具模式）中获得 33.7% 的分数，明显优于上一代旗舰 Gemini2.5Pro;

– 在 LMArena 文本能力榜上升至全球第三。

这背后来自谷歌对模型架构的深入打磨：在保持极低推理开销的同时，结合知识蒸馏、推理链路压缩与多模态对齐等手段，让小体量也拥有接近大模型的逻辑深度。无论上传图片还是视频，Flash 都能在数秒内理解内容并给出可执行方案——从排查电路故障到规划出行路线，速度快到接近瞬时。

为覆盖多样使用场景，新版Gemini App提供三种交互模式:

– 极速模式: 默认使用 Gemini3Flash，适合日常问答;

– 思考模式: 打开 Flash 的深度推理链，应对复杂逻辑;

– 专业模式: 继续提供 Gemini3Pro，专注高难度数学与编程任务。

这也就意味着，普通用户不花钱就能用到过去只在高阶订阅里提供的智能体验。你在 Google 搜索里抛出的复杂问题，背后已经有融合顶级推理能力的 AI 引擎在支撑。

市场表现也给出了正反馈：Gemini App 月活在一个季度内从 4.5 亿跃至 6.5 亿，开发者数量突破 1300 万，API 调用量同比增长 3 倍。随着 Flash 加入，Gemini3 系列已形成清晰梯队——Deep Think（深度推理）、Pro(专业攻坚)、Flash(普惠极速)——覆盖从大众到科研与开发者的全谱化需求。

当免费型号开始跑赢付费旗舰，AI 的赛点已不再只是参数规模，而是效率、体验与普惠的综合能力。谷歌借 Gemini3Flash 明确表达：下一代 AI，不仅要聪明，更要快、要省、要人人可用。