在2025年科大讯飞1024开发者节上,科大讯飞官宣AI软硬一体解决方案,通过AI算法与硬件架构的深度协同,在高噪声、远场等复杂场景实现准确识别与理解。这一突破被视为语音与视觉智能融合领域的关键迈进。
讯飞称,传统AI语音识别系统在嘈杂环境中容易出现识别率下滑。对此,科大讯飞在软硬件一体化设计上做了系统性创新,让AI不仅能“听得清”,还能“看得懂”。

依托这一方案,讯飞多款AI硬件的降噪与识别表现明显增强:
-
讯飞智能办公本 X5 搭载业内首创“上4下4环”八麦克风阵列,在远场高噪音环境下的识别表现远超 iPhone17Pro;
-
讯飞 AI 翻译耳机 在地铁、展会等复杂场景中识别准确率可达 97.1%;
-
讯飞双屏翻译机2.0 在 90dB 工厂轰鸣声下仍可实现 98.69% 的语音识别准确率。
讯飞表示,上述成果源于其在语音增强、声源定位、回声抑制和多模态感知算法上的长期沉淀。
在本次开发者节上,科大讯飞还推出了基于 星火语音大模型 的“百变声音复刻”技术。用户只需一句录音即可高保真复刻任意音色,并可通过一条指令生成不同风格的声音输出。
这项技术的到来,意味着个性化语音创作进入普及阶段。它可广泛应用于数字人、有声读物、影视配音、内容创作等领域,让每个人都能快速打造属于自己的“AI声音分身”。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END
















用户38505528 1个月前0
粘贴不了啊用户12648782 2个月前0
用法杂不对呢?yfarer 2个月前0
草稿id无法下载,是什么问题?