OpenAI全力押注“语音优先”!合并多团队重塑音频模型,首款AI语音硬件或明年亮相

当基于屏幕的交互越来越显疲态时,科技巨头正集体转向一种更自然、更沉浸的方式——语音。根据《The Information》最新消息,OpenAI已低调整合多支工程、产品与研究团队,重做其音频AI系统,为一款预计在2026年落地的“语音优先”个人设备铺路。这不仅是技术层面的升级,更是OpenAI对“后屏幕时代”人机交互方向的明确押注。

 从“辅助”到“主入口”:OpenAI重启音频战略

全新音频模型预计将在2026年初亮相,将带来三项关键突破:

– 语音合成更逼真,更贴近人类的语气与节奏;

– 支持真正的对话式打断——用户可随时插话,AI能即时接话与响应;

首次实现“边听边说”(concurrent speech)能力,即在用户说话时同步给出反馈,打破现有“说完再听”的僵硬流程。

更进一步,OpenAI还在规划一系列以音频为先的硬件形态,或包括无屏智能音箱、AI眼镜及可穿戴设备,目标不只是工具,而是成为用户的“智能伙伴”。

 行业共振:语音正成下一代入口

OpenAI并非孤例,整个科技生态都在加速向语音迁移:

– Meta 为 Ray-Ban 智能眼镜配备五麦克风阵列,支持在嘈杂环境中的定向拾音;

– Google 推出“Audio Overviews”,把搜索结果生成对话式语音摘要;

– Tesla 将 xAI 的 Grok 聊天机器人深度接入车机,用自然语言操控导航、空调等功能;

– 初创公司如 Sandbar,以及前 Pebble 创始人 Eric Migicovsky 的新公司,均计划在2026年推出AI语音戒指,实现“抬手即对话”。

即便 Humane AI Pin、Friend AI 项链等早期产品遭遇滑铁卢,市场仍普遍相信:语音是通向无感、无缝、无屏智能体验的关键路径。

 Jony Ive入局:用音频“修正”科技成瘾

值得注意的是,OpenAI的硬件愿景深受前苹果设计灵魂人物 Jony Ive 影响。今年5月,OpenAI以65亿美元收购 Ive 的公司 LoveFrom(报道中称“io”),并将其纳入硬件团队。Ive 公开表示,希望以“音频优先”的设计来“纠正过去消费电子制造的错误”——减少对屏幕的依赖,缓解数字成瘾,让技术回归服务人的本质。

 AIbase观察:语音战争,本质是“注意力争夺”

当每个空间——客厅、驾驶舱、手腕、甚至眼镜——都成为语音入口,竞争已不止是技术比拼,而是直指人类最稀缺的资源:注意力。

OpenAI的目标,不只是让 ChatGPT“说得更像人”,而是让AI无处不在却又“隐身”,以声音融入生活流,成为用户思维的延伸。

一旦成功,OpenAI或将定义继智能手机之后的下一代个人计算平台。而这场低调却深刻的“语音革命”,或许正从一句“Hey,ChatGPT…”悄然开启。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞5 分享