谷歌日前推出了 Gemini2.5Flash Native Audio 的新版,显著强化其语音助手能力。该版本旨在更稳妥地处理复杂流程,提升执行用户指令的准确度,同时让对话更加自然顺畅。依据谷歌披露的数据,新版在开发者指令的遵循率上从84% 提升至90%,表明在理解与落实用户请求方面取得了明显进展。
在多步骤对话的表现上,更新也带来清晰提升。用户与语音助手互动时将感受到更连贯的沟通体验。这一改进让助手更能适配复杂的提问与任务,为用户提供更高效的服务。
谷歌同时表示,升级后的音频模型在 ComplexFuncBench 基准测试中,函数调用准确率达到 71.5%;作为对照,OpenAI 的 gpt-realtime 为 66.5%。需要说明的是,本次评测中谷歌可能未采用 OpenAI 最近发布的最新版本。
目前,该更新已在 Google AI Studio、Vertex AI、Gemini Live 和 Search Live 上线,Google Cloud 的客户也已开始使用。开发者可以通过 Gemini API 对模型进行测试,进一步挖掘其潜力。
此次升级不仅带来功能层面的强化,也体现了谷歌在人工智能领域持续精进的决心,旨在为用户提供更佳的体验。
划重点:
🌟 指令遵循率由84% 升至90%。
📈 ComplexFuncBench 函数调用准确率达71.5%。
💻 开发者可通过 Gemini API 试用新模型,体验改进能力。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END

















用户38505528 2个月前0
粘贴不了啊用户12648782 3个月前0
用法杂不对呢?yfarer 3个月前0
草稿id无法下载,是什么问题?