谷歌上新 Gemini2.5Flash Native Audio，语音助手更上一层楼-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

谷歌近日推出 Gemini2.5Flash Native Audio 的新版，显著强化了语音助手的能力。该版本更擅长处理复杂流程，提升执行用户指令的准确度，同时让对话更自然顺畅。依据谷歌披露的数据，新版对开发者指令的遵循率由 84% 提升至 90%，显示在理解与落实用户请求方面有了明显进步。

在多步骤、多轮对话的表现上，这次更新也带来了清晰的提升。用户与语音助手互动时，会感到沟通更连贯、更省心。这些改进让助手更能应对复杂的提问与任务，整体服务效率更高。

谷歌还表示，更新后的音频模型在 ComplexFuncBench 基准中，函数调用准确率达到 71.5%；作为对比，OpenAI 的 gpt-realtime 为 66.5%。不过需说明的是，谷歌在测试时可能并未使用 OpenAI 近期发布的最新版本。

此次更新已在 Google AI Studio、Vertex AI、Gemini Live 与 Search Live 上线，Google Cloud 客户也已开始接入。开发者可以通过 Gemini API 测试该模型，进一步挖掘其潜能。

这次升级不仅是功能层面的增强，也体现了谷歌在人工智能领域持续迭代的决心，致力于为用户带来更好的使用体验。

划重点:

🌟 指令遵循率由 84% 升至 90%，理解与执行更到位。

📈 ComplexFuncBench 基准中，函数调用准确率达到 71.5%。

💻 开发者可通过 Gemini API 直接测试新模型，体验这些改进。

AI智能体所有文章，如无特殊说明或标注，均为本站作者原创发布。任何个人或组织，在未征得作者同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益，可联系客服处理。

THE END

谷歌上新 Gemini2.5Flash Native Audio，语音助手更上一层楼