在AI语音领域,如何兼顾通用性与准确度一直是行业难题。4 月 20 日,阿里通义实验室正式发布语音识别大模型 Fun-ASR1.5。依托统一的大模型架构,它在多语言、多方言以及复杂语境中实现了显著突破。
据悉,Fun-ASR1.5 的“听力”可谓全能。它不仅覆盖全球 30 种主流语言,还深度适配汉语的七大方言体系和 20 多种地方口音。更受关注的是,该模型在传统文化场景同样表现亮眼,即便遇到语调起伏、断句独特的古诗词吟诵,也能实现实时转写,且准确度极高。
目前,Fun-ASR1.5 已在阿里云百炼平台上线。阿里通义实验室表示,该模型将通过 API 服务,为教育、传媒、金融、科技及文化等多个行业客户提供高效语音技术支撑,助力各产业推进智能化办公与内容生产升级。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END

















用户38505528 7个月前0
粘贴不了啊用户12648782 8个月前0
用法杂不对呢?yfarer 8个月前0
草稿id无法下载,是什么问题?