智谱 AI 输入法重磅上线,语音识别方案同步开源

智谱 AI 正式上线其最新的 GLM-ASR 系列语音识别模型,并同步开放相关技术开源,旨在为广大用户带来更高效的语音交互体验。此次发布还包含一款桌面端的“智谱 AI 输入法”,让 PC 端的语音输入更加便捷。

image.png

GLM-ASR-2512 是智谱 AI 推出的全球领先云端语音识别模型,支持实时语音转写,在复杂真实环境下表现稳健,字符错误率(CER)仅为 0.0717。借助这一出色的识别精度,它在多场景、多语种与多口音应用中依旧保持行业领先。

除 GLM-ASR-2512 外,智谱 AI 还将 GLM-ASR-Nano-2512 开源。该模型仅 1.5B 参数,在开源语音识别领域达到 SOTA 水平,部分测试甚至优于一些闭源方案。GLM-ASR-Nano-2512 可在本地运行,既保证高精度识别,又更好保护隐私,并显著降低交互延迟。

依托上述两款模型的强大能力,智谱 AI 发布了全新的智谱 AI 输入法。用户不仅可实现精准的语音转文字,还能一键完成翻译与文本改写等智能操作,真正实现“指尖即模型,语音即指令”的便捷使用体验。目前,智谱 AI 输入法面向所有用户开放,新注册用户可获 2000 积分,享受最长 28 天的免费使用期。

GLM-ASR-Nano-2512:Hugging Face:https://huggingface.co/zai-org/GLM-ASR-Nano-2512

智谱 AI 输入法:https://autoglm.zhipuai.cn/autotyper/

划重点:

🌟 GLM-ASR 系列重磅发布,涵盖云端与端侧模型,识别精度表现优异。  

🛠️ 新版智谱 AI 输入法上线,支持语音转写、翻译与改写,带来顺畅的 PC 端语音交互体验。  

🎁 新用户赠送 2000 积分,可免费体验最长 28 天,欢迎更多用户轻松上手智能输入法。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞8 分享