Gemini 3 Flash发布:免费又快,实测超越Pro,谷歌AI迈入“几乎零等待”时代

谷歌又一次把大模型的性能与成本边界推得更远。今天,正式推出全新轻量级模型 Gemini3Flash——在保持极低延迟的同时,响应速度达到前代的3倍,几乎“无等待”;并且在多项硬核基准上反超同代旗舰 Gemini3Pro,成为首个在同场对比里“小体量胜大杯”的 Flash 系列。更出乎意料的是,这一高端性能版本面向全球免费开放,已默认集成于 Gemini App、AI Studio、Google Antigravity 以及 CLI 工具。

Gemini3Flash的成绩可以说是“降维式碾压”:

– 在代码修复权威基准 SWE-bench 上,取得 78% 分数,略高于 Gemini3Pro 的 76.2%;

– 在博士级推理评测 GPQA Diamond 中拿到 90.4%;

– 在极难的综合测试 Humanity’s Last Exam(无工具模式)中达到 33.7%,明显优于前代旗舰 Gemini2.5Pro;

– 在 LMArena 文本能力榜单上升至全球第三。

image.png

这背后来自谷歌对模型架构的深度打磨:在压低推理成本的同时,通过知识蒸馏、推理路径压缩与多模态对齐等方法,让小模型也能具备接近大模型的逻辑深度。无论上传图片还是视频,Flash 都能在数秒内完成理解并给出可执行方案——从定位电路故障到制定旅行路线,响应快得像闪电。

为了覆盖不同使用场景,新版 Gemini App 提供三种交互档位:

– 极速模式:默认启用 Gemini3Flash,适合日常问答;

– 思考模式:打开 Flash 的深度推理链,处理复杂逻辑;

– 专业模式:保留 Gemini3Pro,聚焦高难度数学与编程任务。

这意味着,普通用户不必付费,也能享受过去只在高阶订阅中提供的智能体验。你在 Google 搜索里提出的复杂问题,背后已由融合顶级推理能力的 AI 引擎驱动。

image.png

市场反馈也给出了强力背书:Gemini App 月活从一个季度内的 4.5 亿跃升至 6.5 亿,开发者规模超过 1300 万,API 调用量同比增长 3 倍。随着 Flash 加入,Gemini3 形成清晰产品梯队——Deep Think(深度推理)、Pro(专业攻坚)、Flash(普惠极速)——面向从大众用户到科研与开发者的全谱系需求。

当免费款开始跑赢付费旗舰,AI 的竞争已不仅是参数规模的较量,更是效率、体验与普惠的综合比拼。谷歌用 Gemini3Flash 表明:下一代 AI,不止要聪明,更要快、省、人人可用。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享