Google 上线 Gemini API 文件搜索工具:简化私有 RAG 接入,开发者免自建向量数据库

Google 今日宣布在 Gemini API 中上线“文件搜索工具”(File Search Tool),这是一套完全托管的 RAG 方案。该工具可将私有文件直接转为 Gemini 的知识库,开发者不必操心数据切分、嵌入生成或向量库管理,接入 API 即可实现高效检索与内容生成。

QQ20251107-114622.png

工具核心亮点:RAG 全流程一站式打包文

文件搜索工具主打端到端集成。它会自动完成文件上传、索引到检索的全流程,借助 Google 的 Gemini Embedding 模型(gemini-embedding-001)生成高质量向量表示,支持语义级搜索而非简单关键词匹配。这样一来,开发者可以把精力放在业务逻辑上,而不是底层基础设施的搭建与维护。

据 Google 官方博客介绍,该工具支持多种常见文件类型,包括 PDF、DOCX、TXT、JSON,以及各类代码文件(如 Python、Java 等源代码)。用户只需通过 Gemini API 的 generateContent 接口调用,就能把私有文档导入知识库。系统会智能进行内容分块,保证检索出的上下文更连贯,并在回复中自动附上引用链接,直达文档对应片段,提升结果的透明度和可验证性。

这一能力非常适合企业应用场景,比如内部知识助理、智能客服机器人或内容检索平台。Google 表示,对于数据量大、更新频繁、查询重复度高或需要严格溯源的项目,这款工具能明显降低开发门槛,同时提供可扩展的性能支持。

创新计费模式:查询免费,首次索引低至0.15美元/百万词元

不同于传统 RAG 方案,文件搜索工具采用新的计费方式:在查询阶段的存储与嵌入生成均免费,只有在首次为文件建立索引时才会收取嵌入生成费用。计费按词元(token)计算,使用 gemini-embedding-001 模型的标准价格为每百万词元 0.15 美元。这让整体成本更可控,尤其适用于大规模上线或试验项目。Google 产品经理表示:“这种计费策略大幅降低了 RAG 落地的入门成本与运营负担,让开发者能更快把 AI 用起来。” 后续文件更新或增量索引仅对变化部分计费,进一步提升资源使用效率。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞5 分享