Reverie 推出面向印度的语音识别模型,表现领先 Deepgram

在公司成立16周年之际,Reverie Language Technologies 发布了一款全新的语音转文本(STT)模型,专为印度复杂多样的语言环境打造。该模型不仅支持印地语和英语,还能处理英语与印地语混合的 Hinglish,用起来非常适合银行、客服中心等业务场景。

语音控制

图源备注:图片由AI生成,图片授权服务商Midjourney

据 Reverie 介绍,这套模型在过去一年已处理了300万次 API 请求,在准确度和响应速度方面都有亮眼表现。独立对比测试显示,相比 Deepgram,Reverie 的模型准确率提升约4.2%,响应速度快到原来的1.5倍,更适合面向印度用户的语音识别应用。

这款模型的核心优势在于对多语言混用和本土语境的理解。不管是英语里的 “twenty-three”,还是印地语里的 “तेईस”,它都能准确识别。同时还能识别来自印度各地的人名,兼顾拼写和发音差异,这往往是通用型全球模型的弱项。

除了 Hinglish,Reverie 还推出了覆盖多种印度语言的 STT 模型,包含泰米尔语、泰卢固语、孟加拉语、马拉地语、古吉拉特语、卡纳达语、马拉雅拉姆语、阿萨姆语、奥里亚语和旁遮普语。每个模型都针对各自语言的方言与口音进行独立训练,更贴近当地人的真实表达。

Reverie 的 R&D 负责人 Pranjal Nayak 表示:“我们的研发长期聚焦印度独有的语言难题,这款 Hinglish 模型就是一个代表性成果。它能够理解印度人在报数字时的习惯,以及在一句话里混合使用英语和印地语的方式。” 这让 AI 代理的对话更自然、更有人情味。

该模型已在多行业落地,例如某大型金融服务公司使用 Reverie 的 STT 引擎处理超过15,000个多语种的债务催收电话,成功实现对数字与付款信息的高准确识别。

目前,这款模型已在 Reverie 的 API 平台上线,企业可选择云端或本地部署。它支持领域专用词包、数字与姓名的歧义消解、热词增强等功能,且所有配置均可通过同一个 API 完成。

划重点:

🌟 新模型在准确率与响应速度上领先 Deepgram,更贴合印度市场需求。  

💬 Reverie 模型能理解 Hinglish 等多语言混用,并具备对本土文化的深入理解。  

📈 多行业已开始应用,显著提升语音识别的准确性与效率。  

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞10 分享