当屏幕式交互日渐疲惫时,科技巨头正集体转向一种更自然、更沉浸的方式——语音。据《The Information》最新报道,OpenAI已悄然整合工程、产品与研究团队,全面重做其音频AI系统,为预计在2026年推出的语音优先个人设备铺路。这不仅是一次技术升级,更是OpenAI对“后屏幕时代”人机交互终局的明确下注。
从“辅助功能”到“核心交互”:OpenAI重塑音频战略
全新音频模型预计将于2026年初亮相,将带来三项关键升级:
– 语音合成更自然,贴近人类的语气与节奏;
– 支持真实对话中的打断——用户随时插话,AI立即跟上;
– 首次实现“边听边说”(concurrent speech)能力,即在用户说话时同步给出反馈,打破当前AI“说完才能听”的僵化交互模式。
更关键的是,OpenAI正规划一系列以音频为先的硬件产品,可能包括无屏智能音箱、AI眼镜或可穿戴设备,目标不只是工具,而是用户的“智能伴侣”。
行业共振:语音正成下一代入口
– Meta在Ray-Ban智能眼镜中加入五麦克风阵列,可在嘈杂环境实现定向拾音;
– Google推出“Audio Overviews”,把搜索结果转化为对话式语音摘要;
– Tesla将xAI的Grok聊天机器人深度集成到车载系统,用自然语言操控导航、空调等全车功能;
– 初创公司如Sandbar、以及前Pebble创始人Eric Migicovsky的新公司,均计划在2026年推出AI语音戒指,实现“抬手即对话”。
尽管Humane AI Pin、Friend AI项链等早期尝试遭遇挫折,市场仍普遍认同:语音是通往无感、无缝、无屏智能体验的关键路径。
Jony Ive入局:用音频“修正”科技成瘾
值得注意的是,OpenAI的硬件愿景深受前苹果设计领军人物Jony Ive影响。今年5月,OpenAI以65亿美元收购Ive的公司LoveFrom(报道中称“io”),并将其引入硬件团队。Ive公开表示,希望借由音频优先的设计来“纠正过去消费电子制造的错误”——减少屏幕依赖、缓解数字成瘾,让技术回归服务人的本质。
行业观察:语音战争,本质是“注意力争夺”
当客厅、驾驶舱、手腕,甚至眼镜都成为语音交互入口,竞争已超越技术本身,直指人类最稀缺的资源:注意力。
OpenAI的野心,不只是让ChatGPT“更会说”,而是让AI无处不在却又不打扰,通过声音融入生活流,成为用户思维的延伸。
若顺利,OpenAI或将定义继智能手机之后的下一代个人计算平台。而这场低调却深刻的“语音革命”,正从一句“Hey, ChatGPT…”悄然开启。

















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?