近日,清华大学 NLP 实验室携手 OpenBMB 与面壁智能,共同推出并开源了 UltraEval-Audio——一款面向音频模型的评测框架。UltraEval-Audio 不仅为音频大模型构建了一套系统化的评测方法论,还将其落地为可直接使用的工程工具,进一步完善了音频评测的整体体系。

UltraEval-Audio 的最新版本 v1.1.0 在延续“一键测评”能力的基础上,加入了热门音频模型的一键复现功能,并扩展支持文本转语音(TTS)、自动语音识别(ASR)、编解码(Codec)等专业方向。同时,该版本引入“隔离推理”运行机制,帮助降低复现难度,提升评测流程的可控性与迁移性。
值得一提的是,UltraEval-Audio v1.1.0 已被 MiniCPM-o2.6、VoxCPM 等多款高影响力的音频与全模态模型采用为核心评测工具。此次开源将显著提升研究者在音频模型开发和验证中的效率,推动相关研究持续向前。
项目仓库现已公开,研究者可前往 GitHub 了解更多细节。UltraEval-Audio 的发布,为音频模型评测的标准化进程再添一砖,加速音频技术的落地与发展。
开源地址:https://github.com/OpenBMB/UltraEval-Audio
划重点:
🌟 UltraEval-Audio 是音频模型评测框架,由清华 NLP 实验室、OpenBMB 与面壁智能联合推出。
🚀 最新版本 v1.1.0 新增“一键复现”,并覆盖更多专业模型评测。
📈 开源将显著提升研发效率,推进音频模型领域的进展。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END

















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?