当基于屏幕的交互越来越显疲态时,科技巨头正集体转向一种更自然、更沉浸的方式——语音。根据《The Information》最新消息,OpenAI已低调整合多支工程、产品与研究团队,重做其音频AI系统,为一款预计在2026年落地的“语音优先”个人设备铺路。这不仅是技术层面的升级,更是OpenAI对“后屏幕时代”人机交互方向的明确押注。
从“辅助”到“主入口”:OpenAI重启音频战略
全新音频模型预计将在2026年初亮相,将带来三项关键突破:
– 语音合成更逼真,更贴近人类的语气与节奏;
– 支持真正的对话式打断——用户可随时插话,AI能即时接话与响应;
– 首次实现“边听边说”(concurrent speech)能力,即在用户说话时同步给出反馈,打破现有“说完再听”的僵硬流程。
更进一步,OpenAI还在规划一系列以音频为先的硬件形态,或包括无屏智能音箱、AI眼镜及可穿戴设备,目标不只是工具,而是成为用户的“智能伙伴”。
行业共振:语音正成下一代入口
OpenAI并非孤例,整个科技生态都在加速向语音迁移:
– Meta 为 Ray-Ban 智能眼镜配备五麦克风阵列,支持在嘈杂环境中的定向拾音;
– Google 推出“Audio Overviews”,把搜索结果生成对话式语音摘要;
– Tesla 将 xAI 的 Grok 聊天机器人深度接入车机,用自然语言操控导航、空调等功能;
– 初创公司如 Sandbar,以及前 Pebble 创始人 Eric Migicovsky 的新公司,均计划在2026年推出AI语音戒指,实现“抬手即对话”。
即便 Humane AI Pin、Friend AI 项链等早期产品遭遇滑铁卢,市场仍普遍相信:语音是通向无感、无缝、无屏智能体验的关键路径。
Jony Ive入局:用音频“修正”科技成瘾
值得注意的是,OpenAI的硬件愿景深受前苹果设计灵魂人物 Jony Ive 影响。今年5月,OpenAI以65亿美元收购 Ive 的公司 LoveFrom(报道中称“io”),并将其纳入硬件团队。Ive 公开表示,希望以“音频优先”的设计来“纠正过去消费电子制造的错误”——减少对屏幕的依赖,缓解数字成瘾,让技术回归服务人的本质。
AIbase观察:语音战争,本质是“注意力争夺”
当每个空间——客厅、驾驶舱、手腕、甚至眼镜——都成为语音入口,竞争已不止是技术比拼,而是直指人类最稀缺的资源:注意力。
OpenAI的目标,不只是让 ChatGPT“说得更像人”,而是让AI无处不在却又“隐身”,以声音融入生活流,成为用户思维的延伸。
一旦成功,OpenAI或将定义继智能手机之后的下一代个人计算平台。而这场低调却深刻的“语音革命”,或许正从一句“Hey,ChatGPT…”悄然开启。

















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?