谷歌更新 Gemini2.5Flash Native Audio，语音助手表现再升级-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

谷歌日前推出了 Gemini2.5Flash Native Audio 的新版，显著强化其语音助手能力。该版本旨在更稳妥地处理复杂流程，提升执行用户指令的准确度，同时让对话更加自然顺畅。依据谷歌披露的数据，新版在开发者指令的遵循率上从84% 提升至90%，表明在理解与落实用户请求方面取得了明显进展。

在多步骤对话的表现上，更新也带来清晰提升。用户与语音助手互动时将感受到更连贯的沟通体验。这一改进让助手更能适配复杂的提问与任务，为用户提供更高效的服务。

谷歌同时表示，升级后的音频模型在 ComplexFuncBench 基准测试中，函数调用准确率达到 71.5%；作为对照，OpenAI 的 gpt-realtime 为 66.5%。需要说明的是，本次评测中谷歌可能未采用 OpenAI 最近发布的最新版本。

目前，该更新已在 Google AI Studio、Vertex AI、Gemini Live 和 Search Live 上线，Google Cloud 的客户也已开始使用。开发者可以通过 Gemini API 对模型进行测试，进一步挖掘其潜力。

此次升级不仅带来功能层面的强化，也体现了谷歌在人工智能领域持续精进的决心，旨在为用户提供更佳的体验。