阿里通义实验室发布语音识别大模型 Fun-ASR1.5:30 种语言、方言与古诗吟诵都能秒转!

在AI语音领域,如何兼顾通用性与准确度一直是行业难题。4 月 20 日,阿里通义实验室正式发布语音识别大模型 Fun-ASR1.5。依托统一的大模型架构,它在多语言、多方言以及复杂语境中实现了显著突破。

据悉,Fun-ASR1.5 的“听力”可谓全能。它不仅覆盖全球 30 种主流语言,还深度适配汉语的七大方言体系和 20 多种地方口音。更受关注的是,该模型在传统文化场景同样表现亮眼,即便遇到语调起伏、断句独特的古诗词吟诵,也能实现实时转写,且准确度极高

目前,Fun-ASR1.5 已在阿里云百炼平台上线。阿里通义实验室表示,该模型将通过 API 服务,为教育、传媒、金融、科技及文化等多个行业客户提供高效语音技术支撑,助力各产业推进智能化办公与内容生产升级。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞13 分享