谷歌(Google)发布了 Gemini3系列的最新成员——Gemini3.1Flash-Lite。这款轻量模型在该系列中兼具最快速度与高性价比的定位,上线也代表着谷歌在“高性价比AI”方向继续加码,力图为开发者带来更极致的实时交互体验。

性能方面,Gemini3.1Flash-Lite 带来显著升级。依据权威评测平台的数据,与前代 2.5Flash 相比,其首字响应时间(TTFT)快了 2.5 倍,整体输出速度也提升约 45%。这种超低延迟,使其非常适用于需要即刻反馈的对话机器人与各类实时处理场景。

除了“快”,它还具备极高的“质价比”。谷歌给出颇有竞争力的定价:每百万输入 Token 仅需 0.25 美元。在多项核心能力评测中,3.1Flash-Lite 展现出越级表现,在多模态理解与逻辑推理上领先同级竞品,部分指标甚至超越更大体量的前代模型。

同时,AI Studio 与 Vertex AI 为该模型标配了创新的“思考层级”功能。开发者可按业务需要灵活调节“思考深度”:处理翻译、内容审核等简单任务时优先效率;涉及复杂逻辑推演或数据看板生成时,则释放更深层推理能力。目前,该模型已通过 API 向预览用户及企业级平台同步开放,帮助全球开发者打造低时延的 AI 应用。
划重点:
-
⚡ 响应更快:首字时间提升 2.5 倍,整体速度约快 45%,面向实时交互场景。
-
💰 极致成本控制:输入价格低至 0.25 美元/百万 Token,大幅降低大规模部署门槛。
-
🧠 思考深度可调:新增“思考层级”,可在高效率与深度推理之间自由切换。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 6个月前0
粘贴不了啊用户12648782 7个月前0
用法杂不对呢?yfarer 7个月前0
草稿id无法下载,是什么问题?