响应快到飞起!谷歌发布 Gemini 3.1 Flash-Lite:首字时间提速 2.5 倍,算力成本再降

谷歌(Google)发布了 Gemini3系列的最新成员——Gemini3.1Flash-Lite。这款轻量模型在该系列中兼具最快速度与高性价比的定位,上线也代表着谷歌在“高性价比AI”方向继续加码,力图为开发者带来更极致的实时交互体验。

image.png

性能方面,Gemini3.1Flash-Lite 带来显著升级。依据权威评测平台的数据,与前代 2.5Flash 相比,其首字响应时间(TTFT)快了 2.5 倍,整体输出速度也提升约 45%。这种超低延迟,使其非常适用于需要即刻反馈的对话机器人与各类实时处理场景。

image.png

除了“快”,它还具备极高的“质价比”。谷歌给出颇有竞争力的定价:每百万输入 Token 仅需 0.25 美元。在多项核心能力评测中,3.1Flash-Lite 展现出越级表现,在多模态理解与逻辑推理上领先同级竞品,部分指标甚至超越更大体量的前代模型。

image.png

同时,AI Studio 与 Vertex AI 为该模型标配了创新的“思考层级”功能。开发者可按业务需要灵活调节“思考深度”:处理翻译、内容审核等简单任务时优先效率;涉及复杂逻辑推演或数据看板生成时,则释放更深层推理能力。目前,该模型已通过 API 向预览用户及企业级平台同步开放,帮助全球开发者打造低时延的 AI 应用。

划重点:

  • 响应更快:首字时间提升 2.5 倍,整体速度约快 45%,面向实时交互场景。

  • 💰 极致成本控制:输入价格低至 0.25 美元/百万 Token,大幅降低大规模部署门槛。

  • 🧠 思考深度可调:新增“思考层级”,可在高效率与深度推理之间自由切换。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享