可穿戴设备正迈入“感知升级”新阶段。中国AI声学企业声智科技(SoundAI)宣布,其全球首款多模态AI时尚耳机将于海外知名众筹平台Kickstarter全球首发。新品打破传统耳机只做音频交互的边界,把视觉感知与声学交互合到一起,定位为用户的“随身感知工具”,让AI做到“看得见、听得清、回得准”。
声视协同:眼睛来“看”,耳朵来“说”
不同于普通AI耳机仅依赖麦克风阵列,这次的产品加入微型视觉传感器,并配合自研多模态大模型,实现“视觉场景校验 + 声学结果输出”的闭环体验:
– 视觉端:通过轻量摄像头或环境光感知,判断用户所在场景(如咖啡馆、会议室、街道);
– 声学端:根据场景智能调整降噪策略、语音唤醒敏感度和TTS发声风格;
– 交互闭环:例如在嘈杂街头,耳机识别“户外”后自动加强语音听感清晰度;进入会议室则切至“静音模式”,仅用骨传导提醒日程。
这套设计能有效减少纯语音AI在复杂环境下的误触发与响应偏差,明显提升交互稳定性。
全栈声学底座,软硬协同赋能
产品基于声智科技自研的全栈声学技术系统,覆盖远场语音识别、声源定位、回声消除、个性化声纹建模等关键能力,并内置多模态大模型推理引擎,可在端侧完成低时延的场景理解,兼顾隐私与响应速度。
时尚设计+全球首发,瞄准高端消费市场
作为“时尚耳机”,该产品由国际化设计团队打造,兼顾外观与佩戴舒适度,目标人群包括科技爱好者、商务人士与数字游民。选择在Kickstarter首发,是为了借助全球早期用户的反馈,快速打磨产品并提升海外品牌认知。
业内观点认为,声智科技此举意味着AI可穿戴设备正从“语音助手”迈向“环境感知智能体”。当耳机不仅能听指令,还能“看懂”你所处的环境,人机交互的自然度与主动性将迎来跃升。而这股由声智推动的“声视融合”趋势,或将成为下一代智能硬件的重要入口。

















用户38505528 6个月前0
粘贴不了啊用户12648782 7个月前0
用法杂不对呢?yfarer 7个月前0
草稿id无法下载,是什么问题?