OpenAI押注“语音优先”未来!整合多团队重造音频模型,首款AI音频硬件或将于2026年亮相

当屏幕式交互日渐疲惫时,科技巨头正集体转向一种更自然、更沉浸的方式——语音。据《The Information》最新报道,OpenAI已悄然整合工程、产品与研究团队,全面重做其音频AI系统,为预计在2026年推出的语音优先个人设备铺路。这不仅是一次技术升级,更是OpenAI对“后屏幕时代”人机交互终局的明确下注。

 从“辅助功能”到“核心交互”:OpenAI重塑音频战略

全新音频模型预计将于2026年初亮相,将带来三项关键升级:

– 语音合成更自然,贴近人类的语气与节奏;

– 支持真实对话中的打断——用户随时插话,AI立即跟上;

首次实现“边听边说”(concurrent speech)能力,即在用户说话时同步给出反馈,打破当前AI“说完才能听”的僵化交互模式。

更关键的是,OpenAI正规划一系列以音频为先的硬件产品,可能包括无屏智能音箱、AI眼镜或可穿戴设备,目标不只是工具,而是用户的“智能伴侣”。

 行业共振:语音正成下一代入口

– Meta在Ray-Ban智能眼镜中加入五麦克风阵列,可在嘈杂环境实现定向拾音;

– Google推出“Audio Overviews”,把搜索结果转化为对话式语音摘要;

– Tesla将xAI的Grok聊天机器人深度集成到车载系统,用自然语言操控导航、空调等全车功能;

– 初创公司如Sandbar、以及前Pebble创始人Eric Migicovsky的新公司,均计划在2026年推出AI语音戒指,实现“抬手即对话”。

尽管Humane AI Pin、Friend AI项链等早期尝试遭遇挫折,市场仍普遍认同:语音是通往无感、无缝、无屏智能体验的关键路径。

 Jony Ive入局:用音频“修正”科技成瘾

值得注意的是,OpenAI的硬件愿景深受前苹果设计领军人物Jony Ive影响。今年5月,OpenAI以65亿美元收购Ive的公司LoveFrom(报道中称“io”),并将其引入硬件团队。Ive公开表示,希望借由音频优先的设计来“纠正过去消费电子制造的错误”——减少屏幕依赖、缓解数字成瘾,让技术回归服务人的本质。

 行业观察:语音战争,本质是“注意力争夺”

当客厅、驾驶舱、手腕,甚至眼镜都成为语音交互入口,竞争已超越技术本身,直指人类最稀缺的资源:注意力。

OpenAI的野心,不只是让ChatGPT“更会说”,而是让AI无处不在却又不打扰,通过声音融入生活流,成为用户思维的延伸。

若顺利,OpenAI或将定义继智能手机之后的下一代个人计算平台。而这场低调却深刻的“语音革命”,正从一句“Hey, ChatGPT…”悄然开启。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞13 分享