谷歌近日调整了 Gemini API 的收费体系,旨在更贴合用户的推理类使用场景。本次升级新增了多种服务档位:标准、弹性、优先、批量与缓存,用户可按自身业务需要自由选择。
其中,标准档提供基础推理服务,按需使用即可。弹性档是一个新选项,利用非高峰时段的闲置算力,价格约为标准价的五折;其目标延迟在 1 至 15 分钟之间,但不保证固定时延,适合对时间敏感度不高的场景。
批量档同样享有标准价五折优惠,更偏向大规模处理任务,整体延迟可长达 24 小时。对于需要批量查询或处理海量数据的用户,这一档位能显著降低成本。
缓存档按缓存词元数量与存储时长计费,尤其适合频繁复用复杂提示的对话机器人、长视频解析或大文档集检索等场景。该档位有助于更好地管理存储与计算资源,提升系统效率。
优先档价格相较标准档上浮约 75% 至 100%,但可将延迟控制在毫秒到秒级,适用于需要实时响应的业务,如在线客服、实时风控和关键业务智能助手等。谷歌建议对时效要求高的用户选择优先档,以确保应用在响应速度与效率上的最佳表现。
划重点:
🌟 新增多档 Gemini API 服务,满足不同使用场景。
⏳ 弹性与批量档享五折优惠,适合大规模/批处理任务。
⚡ 优先档提供毫秒级响应,适用于实时类应用。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END

















用户38505528 7个月前0
粘贴不了啊用户12648782 8个月前0
用法杂不对呢?yfarer 8个月前0
草稿id无法下载,是什么问题?