响应快到飞起！谷歌发布 Gemini 3.1 Flash-Lite：首字时间提速 2.5 倍，算力成本再降-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

谷歌（Google）发布了 Gemini3系列的最新成员——Gemini3.1Flash-Lite。这款轻量模型在该系列中兼具最快速度与高性价比的定位，上线也代表着谷歌在“高性价比AI”方向继续加码，力图为开发者带来更极致的实时交互体验。

性能方面，Gemini3.1Flash-Lite 带来显著升级。依据权威评测平台的数据，与前代 2.5Flash 相比，其首字响应时间（TTFT）快了 2.5 倍，整体输出速度也提升约 45%。这种超低延迟，使其非常适用于需要即刻反馈的对话机器人与各类实时处理场景。

除了“快”，它还具备极高的“质价比”。谷歌给出颇有竞争力的定价：每百万输入 Token 仅需 0.25 美元。在多项核心能力评测中，3.1Flash-Lite 展现出越级表现，在多模态理解与逻辑推理上领先同级竞品，部分指标甚至超越更大体量的前代模型。

同时，AI Studio 与 Vertex AI 为该模型标配了创新的“思考层级”功能。开发者可按业务需要灵活调节“思考深度”：处理翻译、内容审核等简单任务时优先效率；涉及复杂逻辑推演或数据看板生成时，则释放更深层推理能力。目前，该模型已通过 API 向预览用户及企业级平台同步开放，帮助全球开发者打造低时延的 AI 应用。

划重点: