OpenAI加速音频AI研发 提升对话与响应速度

OpenAI 近期加快推进音频人工智能的研发,为即将到来的语音优先智能设备做准备。根据《The Information》的报道,过去两个月里,OpenAI 已将多支工程、产品和研究团队整合到一起,更集中地攻克音频交互技术。该团队的目标是让语音 AI 的对话表现更自然、响应更迅速,带给用户更顺畅的交流体验。

知情人士表示,现阶段的语音对话模型在准确度和响应速度上仍不如文本模型。为此,OpenAI 正加速升级底层架构,计划在2026年第一季度发布新一代音频模型。新模型将带来更自然、更具情感的语音输出,并能更好地处理实时打断与互动场景。

image.png

这次技术升级不仅是为提升现有语音体验,也与 OpenAI 即将推出的语音优先个人设备密切相关。据报道,这款设备预计在约一年后上市,可能不是单一产品,而是一个系列,涵盖无屏智能眼镜、屏幕极简的语音助手等形态。其设计思路是减少用户对屏幕的依赖,通过自然语音交流提升整体使用感受。

值得关注的是,新音频模型将支持“边听边说”功能,即用户尚未说完,设备便能开始回应,从而实现更流畅的实时互动。这一特性在目前多数语音 AI 产品中并不常见。

总体来看,OpenAI 正在加速迈向“以语音为核心接口”的未来。这不仅是其产品战略的调整,也体现了科技行业对交互模式变革的积极回应。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞10 分享