Gemini 3 Flash发布:免费开放、响应飞快、智力超越Pro,谷歌AI迈入“零延迟”新阶段

谷歌再次把大模型的性能与成本边界向前推了一步。今天,官方上线全新轻量模型 Gemini3Flash——在保证接近“零延迟”的前提下,响应速度比上代快约三倍;更在多项高难度基准上超越同代旗舰 Gemini3Pro,成为史上首个同期对比中“轻量反超旗舰”的 Flash 型号。更出乎意料的是,这一顶尖版本面向全球免费开放,并已默认接入 Gemini App、AI Studio、Google Antigravity 与 CLI 工具。

Gemini3Flash的表现可谓一次“降维打击”:

– 在代码修复权威榜单 SWE-bench 上,以 78% 的成绩略高于 Gemini3Pro(76.2%);

– 在博士级推理集 GPQA Diamond 上取得 90.4% 的高分;

– 在高难综合评测 Humanity’s Last Exam(无工具模式)中获得 33.7% 的分数,明显优于上一代旗舰 Gemini2.5Pro;

– 在 LMArena 文本能力榜上升至全球第三。

image.png

这背后来自谷歌对模型架构的深入打磨:在保持极低推理开销的同时,结合知识蒸馏、推理链路压缩与多模态对齐等手段,让小体量也拥有接近大模型的逻辑深度。无论上传图片还是视频,Flash 都能在数秒内理解内容并给出可执行方案——从排查电路故障到规划出行路线,速度快到接近瞬时。

为覆盖多样使用场景,新版Gemini App提供三种交互模式:

– 极速模式: 默认使用 Gemini3Flash,适合日常问答;

– 思考模式: 打开 Flash 的深度推理链,应对复杂逻辑;

– 专业模式: 继续提供 Gemini3Pro,专注高难度数学与编程任务。

这也就意味着,普通用户不花钱就能用到过去只在高阶订阅里提供的智能体验。你在 Google 搜索里抛出的复杂问题,背后已经有融合顶级推理能力的 AI 引擎在支撑。

image.png

市场表现也给出了正反馈:Gemini App 月活在一个季度内从 4.5 亿跃至 6.5 亿,开发者数量突破 1300 万,API 调用量同比增长 3 倍。随着 Flash 加入,Gemini3 系列已形成清晰梯队——Deep Think(深度推理)、Pro(专业攻坚)、Flash(普惠极速)——覆盖从大众到科研与开发者的全谱化需求。

当免费型号开始跑赢付费旗舰,AI 的赛点已不再只是参数规模,而是效率、体验与普惠的综合能力。谷歌借 Gemini3Flash 明确表达:下一代 AI,不仅要聪明,更要快、要省、要人人可用。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞5 分享