全球7000多种语言中,超过95%长期被AI语音技术忽视——直到现在。Meta最新发布的Omnilingual ASR(自动语音识别)系统,打破语言技术的“大语种优先”局面,首次把高精度识别扩展到1600种语言,并加入创新的“上下文学习”机制。只需几段音频样本,AI就能快速适配一门新语言。这个开源系统不仅技术领先,也承载数字平等的理念,让濒危语种与小语种社区首次走到AI时代的舞台中心。
78%的语言错误率低于10%,小语种不再“失声”
过去的语音技术多集中在英语、中文、西班牙语等主流语种,Omnilingual ASR则把关注点延伸到全球的边缘语言群体。测试显示:在其支持的1600种语言中,78%的语言词错率(WER)低于10%;即使是数据非常稀缺的小语种,也有36%做到低于10%的错误率——这一表现大幅领先以往多语言ASR,让“可用的语音技术”真正覆盖非洲部落、南美原住民、东南亚少数民族等长期被忽视的社区。

几段语音,就能让AI掌握一门新语言
Omnilingual ASR的关键突破是“上下文+少样本”学习。用户只需提供少量已标注的音频-文本对(如3–5句),系统即可通过元学习机制快速适配新语种,无需海量数据或复杂训练流程。由此,模型在理论上可支持5400种以上的语言,几乎涵盖所有有文字记录的语种,为保护全球语言多样性打下技术基础。
开源+社区共建,尊重每一种文化的声音
Meta没有把技术关在实验室,而是全面开源模型与工具链,并联合全球多家语言保护组织与本地社区共同采集语音数据,力求还原真实的发音、语调与文化语境。在巴布亚新几内亚,当地居民用该系统记录祖辈的口述历史;在喜马拉雅山区,僧侣开始把经文语音数字化——AI不再是外来工具,而是文化传承的伙伴。

一场语言平权的数字革命
Omnilingual ASR的意义远不止技术指标。它代表着AI从“服务主流”走向“赋能边缘”,从只看技术转向更尊重文化。当一个只有几千人使用的母语,也能通过语音与数字世界对话时,科技的普惠价值才真正落地。我们认为,Meta此举不仅巩固了其在多模态AI领域的领先地位,也重新定义了科技公司的社会责任——真正的创新,是让最安静的声音也能被听到。在消除语言鸿沟的进程中,Omnilingual ASR或许正是打开“众声齐鸣”的起点。


















用户38505528 2个月前0
粘贴不了啊用户12648782 3个月前0
用法杂不对呢?yfarer 3个月前0
草稿id无法下载,是什么问题?