Google DeepMind 最近发布了 Gemini3.1Flash-Lite 预览版,意味着 Gemini3 系列中速度最快、性价比最高的成员登场。作为 Gemini2.5Flash-Lite 的升级迭代,新模型在保持每秒 360+ token 的高速输出和约 5.1 秒的平均响应时间同时,整体智能水平也有明显提升。依据 Artificial Analysis 的智能指数监测,它比上代提升 12 分至 34 分;在 Arena.ai 排行中也以 1432 的 Elo 分数展现出强劲的人类偏好竞争力。

在多模态与科学推理等关键维度上,Gemini3.1Flash-Lite 表现尤为抢眼:GPQA Diamond 测试拿到 86.9% 高分,MMMU-Pro 准确率达到 76.8%,性能已超过 Claude Opus 4.6 和 Kimi K2.5 等重型模型。值得一提的是,它支持开发者自定义“思考”深度,可灵活适配从简单的自动化翻译到复杂的 UI 搭建等多样场景。

不过,性能与速度的双升级也带来显著的成本变化。Gemini3.1Flash-Lite 的每百万输入 token 价格上调至 0.25 美元,输出价格则由上代的 0.40 美元提升到 1.50 美元,涨幅接近三倍。
这一定价策略反映出在追求极速推理与高精度逻辑平衡之间的成本压力。随着该模型在 Google AI Studio 与 Vertex AI 开放测试,轻量化模型市场正从单纯“拼低价”转向“高性能逻辑下放”的新阶段。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 6个月前0
粘贴不了啊用户12648782 7个月前0
用法杂不对呢?yfarer 7个月前0
草稿id无法下载,是什么问题?