可穿戴设备正迎来一场“感知革命”。中国AI声学领先企业声智科技(SoundAI)宣布,其全球首款多模态AI时尚耳机将在海外知名众筹平台Kickstarter进行全球首发。新品突破传统耳机只做音频交互的限制,创新融合视觉感知与声学交互,定位为用户的“随身感知工具”,让AI真正做到“看得见、听得清、答得准”。
声视融合:用眼睛看,用耳朵说
不同于常见AI耳机仅依赖麦克风阵列,声智此次产品搭载微型视觉传感器与自研多模态大模型,实现“视觉场景验证 + 声学结果交付”的闭环体验:
– 视觉端:通过轻量级摄像头或环境光传感,识别用户所处场景(如咖啡馆、会议室、街道);
– 声学端:根据场景智能优化降噪策略、语音唤醒灵敏度及TTS输出音色;
– 交互闭环:例如在嘈杂街道,耳机识别“户外”后自动增强语音收听清晰度;进入会议室则切换到“静音模式”,仅通过骨传导提示日程。
该设计有效解决纯语音AI在复杂环境中的误触发与响应不准问题,明显提升交互的稳定性与可靠性。
全栈声学底座,软硬一体赋能
产品基于声智科技自研的全栈声学技术体系,覆盖远场语音识别、声源定位、回声消除、个性化声纹建模等核心能力,并集成其多模态大模型推理引擎,可在端侧完成低延迟的场景理解,兼顾用户隐私与响应速度。
时尚设计+全球首发,瞄准高端消费市场
作为“时尚耳机”,新品由国际设计团队操刀,兼顾美学与佩戴舒适,目标用户涵盖科技爱好者、商务人士与数字游民。选择Kickstarter首发,旨在借助全球早期用户反馈,快速迭代并建立海外品牌认知。
AIbase认为,声智科技此举标志着AI可穿戴设备正从“语音助手”迈向“环境感知智能体”。当耳机不仅能听指令,还能“看懂”你所处的世界,人机交互的自然性与主动性将迎来质的飞跃。而这场由声智引领的“声视融合”浪潮,或有望成为下一代智能硬件的关键入口。

















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?