谷歌推出 Gemini API 全新计费方案，推理能力按需收费-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

谷歌近日调整了 Gemini API 的收费体系，旨在更贴合用户的推理类使用场景。本次升级新增了多种服务档位：标准、弹性、优先、批量与缓存，用户可按自身业务需要自由选择。

其中，标准档提供基础推理服务，按需使用即可。弹性档是一个新选项，利用非高峰时段的闲置算力，价格约为标准价的五折；其目标延迟在 1 至 15 分钟之间，但不保证固定时延，适合对时间敏感度不高的场景。

批量档同样享有标准价五折优惠，更偏向大规模处理任务，整体延迟可长达 24 小时。对于需要批量查询或处理海量数据的用户，这一档位能显著降低成本。

缓存档按缓存词元数量与存储时长计费，尤其适合频繁复用复杂提示的对话机器人、长视频解析或大文档集检索等场景。该档位有助于更好地管理存储与计算资源，提升系统效率。

优先档价格相较标准档上浮约 75% 至 100%，但可将延迟控制在毫秒到秒级，适用于需要实时响应的业务，如在线客服、实时风控和关键业务智能助手等。谷歌建议对时效要求高的用户选择优先档，以确保应用在响应速度与效率上的最佳表现。

划重点：

🌟 新增多档 Gemini API 服务，满足不同使用场景。

⏳ 弹性与批量档享五折优惠，适合大规模/批处理任务。

⚡ 优先档提供毫秒级响应，适用于实时类应用。

AI智能体所有文章，如无特殊说明或标注，均为本站作者原创发布。任何个人或组织，在未征得作者同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益，可联系客服处理。

THE END

谷歌推出 Gemini API 全新计费方案，推理能力按需收费