Google 推出 Gemini 3.1 Flash-Lite 预览版:性能大幅跃升,输出价格涨近三倍

Google DeepMind 最近发布了 Gemini3.1Flash-Lite 预览版,意味着 Gemini3 系列中速度最快、性价比最高的成员登场。作为 Gemini2.5Flash-Lite 的升级迭代,新模型在保持每秒 360+ token 的高速输出和约 5.1 秒的平均响应时间同时,整体智能水平也有明显提升。依据 Artificial Analysis 的智能指数监测,它比上代提升 12 分至 34 分;在 Arena.ai 排行中也以 1432 的 Elo 分数展现出强劲的人类偏好竞争力。

gemini

在多模态与科学推理等关键维度上,Gemini3.1Flash-Lite 表现尤为抢眼:GPQA Diamond 测试拿到 86.9% 高分,MMMU-Pro 准确率达到 76.8%,性能已超过 Claude Opus 4.6 和 Kimi K2.5 等重型模型。值得一提的是,它支持开发者自定义“思考”深度,可灵活适配从简单的自动化翻译到复杂的 UI 搭建等多样场景。

QQ20260304-091509.png

不过,性能与速度的双升级也带来显著的成本变化。Gemini3.1Flash-Lite 的每百万输入 token 价格上调至 0.25 美元,输出价格则由上代的 0.40 美元提升到 1.50 美元,涨幅接近三倍。

这一定价策略反映出在追求极速推理与高精度逻辑平衡之间的成本压力。随着该模型在 Google AI Studio 与 Vertex AI 开放测试,轻量化模型市场正从单纯“拼低价”转向“高性能逻辑下放”的新阶段。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享