谷歌更新 Gemini2.5Flash Native Audio,语音助手表现再升级

谷歌日前推出了 Gemini2.5Flash Native Audio 的新版,显著强化其语音助手能力。该版本旨在更稳妥地处理复杂流程,提升执行用户指令的准确度,同时让对话更加自然顺畅。依据谷歌披露的数据,新版在开发者指令的遵循率上从84% 提升至90%,表明在理解与落实用户请求方面取得了明显进展。

在多步骤对话的表现上,更新也带来清晰提升。用户与语音助手互动时将感受到更连贯的沟通体验。这一改进让助手更能适配复杂的提问与任务,为用户提供更高效的服务。

谷歌同时表示,升级后的音频模型在 ComplexFuncBench 基准测试中,函数调用准确率达到 71.5%;作为对照,OpenAI 的 gpt-realtime 为 66.5%。需要说明的是,本次评测中谷歌可能未采用 OpenAI 最近发布的最新版本。

目前,该更新已在 Google AI Studio、Vertex AI、Gemini Live 和 Search Live 上线,Google Cloud 的客户也已开始使用。开发者可以通过 Gemini API 对模型进行测试,进一步挖掘其潜力。

此次升级不仅带来功能层面的强化,也体现了谷歌在人工智能领域持续精进的决心,旨在为用户提供更佳的体验。

划重点:  

🌟 指令遵循率由84% 升至90%。  

📈 ComplexFuncBench 函数调用准确率达71.5%。  

💻 开发者可通过 Gemini API 试用新模型,体验改进能力。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞14 分享