OpenAI 更新 ChatGPT:语音与文字一体化,带来多模态互动体验

近日,OpenAI 在其官网宣布,ChatGPT 已将“语音模式”直接整合进主聊天界面。现在进行语音交流时,用户不仅可以用声音发问,还能在界面中即时看到与对话内容相关的视觉信息,如地图、图片等;系统同时会自动生成文字转录,方便日后回看与检索。

image.png

此前,语音对话是一个独立入口,用户需要手动切换到语音模式。此次升级后,语音交互可直接在主聊天窗口启动,整体体验更顺畅、更高效。这种多模态互动方式既提升信息传递效率,也让交流更有层次。

新版语音模式的亮点之一,是其对视觉信息的实时呈现。OpenAI 的演示显示,当用户用语音提问时,ChatGPT 会自然流畅地以语音回答,并在聊天界面同步展示相关图表和图片。这种结合让用户在获取信息的同时,更直观地理解内容。

为满足不同用户偏好,OpenAI 还加入了“后悔药”选项。喜欢沉浸式纯音频对话的用户,可以在新的设置菜单里一键切回旧版独立语音模式,按需选择更合适的使用方式。

这次更新也体现了 OpenAI 在 AI 产品上的持续探索与创新。此前,他们已推出多项新能力,包括用于商品比价的 AI 购物助手、Atlas AI 浏览器新增对 iCloud 钥匙串的支持,以及在部分地区上线的群聊功能。这些动作都显示出其不断拓展 AI 应用边界的努力。

划重点:  

🌟 ChatGPT 正式把语音模式并入主界面,语音与文字可在同一窗口无缝互动。  

🖼️ 语音提问时,系统会同步展示相关视觉信息,如地图、图片等。  

🔄 提供切换选项,用户可返回传统独立语音模式,按需选择。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞9 分享