谷歌上新 Gemini2.5Flash Native Audio,语音助手更上一层楼

谷歌近日推出 Gemini2.5Flash Native Audio 的新版,显著强化了语音助手的能力。该版本更擅长处理复杂流程,提升执行用户指令的准确度,同时让对话更自然顺畅。依据谷歌披露的数据,新版对开发者指令的遵循率由 84% 提升至 90%,显示在理解与落实用户请求方面有了明显进步。

在多步骤、多轮对话的表现上,这次更新也带来了清晰的提升。用户与语音助手互动时,会感到沟通更连贯、更省心。这些改进让助手更能应对复杂的提问与任务,整体服务效率更高。

谷歌还表示,更新后的音频模型在 ComplexFuncBench 基准中,函数调用准确率达到 71.5%;作为对比,OpenAI 的 gpt-realtime 为 66.5%。不过需说明的是,谷歌在测试时可能并未使用 OpenAI 近期发布的最新版本。

此次更新已在 Google AI Studio、Vertex AI、Gemini Live 与 Search Live 上线,Google Cloud 客户也已开始接入。开发者可以通过 Gemini API 测试该模型,进一步挖掘其潜能。

这次升级不仅是功能层面的增强,也体现了谷歌在人工智能领域持续迭代的决心,致力于为用户带来更好的使用体验。

划重点:  

🌟 指令遵循率由 84% 升至 90%,理解与执行更到位。  

📈 ComplexFuncBench 基准中,函数调用准确率达到 71.5%。  

💻 开发者可通过 Gemini API 直接测试新模型,体验这些改进。  

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞14 分享