谷歌近日推出 Gemini2.5Flash Native Audio 的新版,显著强化了语音助手的能力。该版本更擅长处理复杂流程,提升执行用户指令的准确度,同时让对话更自然顺畅。依据谷歌披露的数据,新版对开发者指令的遵循率由 84% 提升至 90%,显示在理解与落实用户请求方面有了明显进步。
在多步骤、多轮对话的表现上,这次更新也带来了清晰的提升。用户与语音助手互动时,会感到沟通更连贯、更省心。这些改进让助手更能应对复杂的提问与任务,整体服务效率更高。
谷歌还表示,更新后的音频模型在 ComplexFuncBench 基准中,函数调用准确率达到 71.5%;作为对比,OpenAI 的 gpt-realtime 为 66.5%。不过需说明的是,谷歌在测试时可能并未使用 OpenAI 近期发布的最新版本。
此次更新已在 Google AI Studio、Vertex AI、Gemini Live 与 Search Live 上线,Google Cloud 客户也已开始接入。开发者可以通过 Gemini API 测试该模型,进一步挖掘其潜能。
这次升级不仅是功能层面的增强,也体现了谷歌在人工智能领域持续迭代的决心,致力于为用户带来更好的使用体验。
划重点:
🌟 指令遵循率由 84% 升至 90%,理解与执行更到位。
📈 ComplexFuncBench 基准中,函数调用准确率达到 71.5%。
💻 开发者可通过 Gemini API 直接测试新模型,体验这些改进。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END

















用户38505528 2个月前0
粘贴不了啊用户12648782 3个月前0
用法杂不对呢?yfarer 3个月前0
草稿id无法下载,是什么问题?