科大讯飞推出AI软硬一体方案:在90分贝噪声中也能精准识别

在2025年科大讯飞1024开发者节上,科大讯飞官宣AI软硬一体解决方案,通过AI算法与硬件架构的深度协同,在高噪声、远场等复杂场景实现准确识别与理解。这一突破被视为语音与视觉智能融合领域的关键迈进。

讯飞称,传统AI语音识别系统在嘈杂环境中容易出现识别率下滑。对此,科大讯飞在软硬件一体化设计上做了系统性创新,让AI不仅能“听得清”,还能“看得懂”。

科大讯飞 (2)

依托这一方案,讯飞多款AI硬件的降噪与识别表现明显增强:

  • 讯飞智能办公本 X5 搭载业内首创“上4下4环”八麦克风阵列,在远场高噪音环境下的识别表现远超 iPhone17Pro;

  • 讯飞 AI 翻译耳机 在地铁、展会等复杂场景中识别准确率可达 97.1%;

  • 讯飞双屏翻译机2.090dB 工厂轰鸣声下仍可实现 98.69% 的语音识别准确率。

讯飞表示,上述成果源于其在语音增强、声源定位、回声抑制和多模态感知算法上的长期沉淀。

在本次开发者节上,科大讯飞还推出了基于 星火语音大模型 的“百变声音复刻”技术。用户只需一句录音即可高保真复刻任意音色,并可通过一条指令生成不同风格的声音输出。

这项技术的到来,意味着个性化语音创作进入普及阶段。它可广泛应用于数字人、有声读物、影视配音、内容创作等领域,让每个人都能快速打造属于自己的“AI声音分身”。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞6 分享