清华与 OpenBMB 联合发布 UltraEval-Audio:音频模型评测新框架正式开源

近日,清华大学 NLP 实验室携手 OpenBMB 与面壁智能,共同推出并开源了 UltraEval-Audio——一款面向音频模型的评测框架。UltraEval-Audio 不仅为音频大模型构建了一套系统化的评测方法论,还将其落地为可直接使用的工程工具,进一步完善了音频评测的整体体系。

image.png

UltraEval-Audio 的最新版本 v1.1.0 在延续“一键测评”能力的基础上,加入了热门音频模型的一键复现功能,并扩展支持文本转语音(TTS)、自动语音识别(ASR)、编解码(Codec)等专业方向。同时,该版本引入“隔离推理”运行机制,帮助降低复现难度,提升评测流程的可控性与迁移性。

值得一提的是,UltraEval-Audio v1.1.0 已被 MiniCPM-o2.6、VoxCPM 等多款高影响力的音频与全模态模型采用为核心评测工具。此次开源将显著提升研究者在音频模型开发和验证中的效率,推动相关研究持续向前。

项目仓库现已公开,研究者可前往 GitHub 了解更多细节。UltraEval-Audio 的发布,为音频模型评测的标准化进程再添一砖,加速音频技术的落地与发展。

开源地址:https://github.com/OpenBMB/UltraEval-Audio

划重点:  

🌟 UltraEval-Audio 是音频模型评测框架,由清华 NLP 实验室、OpenBMB 与面壁智能联合推出。  

🚀 最新版本 v1.1.0 新增“一键复现”,并覆盖更多专业模型评测。  

📈 开源将显著提升研发效率,推进音频模型领域的进展。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享