谷歌推出 Gemini API 全新计费方案,推理能力按需收费

谷歌近日调整了 Gemini API 的收费体系,旨在更贴合用户的推理类使用场景。本次升级新增了多种服务档位:标准、弹性、优先、批量与缓存,用户可按自身业务需要自由选择。

其中,标准档提供基础推理服务,按需使用即可。弹性档是一个新选项,利用非高峰时段的闲置算力,价格约为标准价的五折;其目标延迟在 1 至 15 分钟之间,但不保证固定时延,适合对时间敏感度不高的场景。

批量档同样享有标准价五折优惠,更偏向大规模处理任务,整体延迟可长达 24 小时。对于需要批量查询或处理海量数据的用户,这一档位能显著降低成本。

缓存档按缓存词元数量与存储时长计费,尤其适合频繁复用复杂提示的对话机器人、长视频解析或大文档集检索等场景。该档位有助于更好地管理存储与计算资源,提升系统效率。

优先档价格相较标准档上浮约 75% 至 100%,但可将延迟控制在毫秒到秒级,适用于需要实时响应的业务,如在线客服、实时风控和关键业务智能助手等。谷歌建议对时效要求高的用户选择优先档,以确保应用在响应速度与效率上的最佳表现。

划重点:  

🌟 新增多档 Gemini API 服务,满足不同使用场景。  

⏳ 弹性与批量档享五折优惠,适合大规模/批处理任务。  

⚡ 优先档提供毫秒级响应,适用于实时类应用。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享