阶跃星辰宣布,其开源原生语音推理模型 Step-Audio-R1.1 在全球权威评测榜单中荣获第一。该榜单由 Artificial Analysis Speech Reasoning 发布,重点考察语音模型在音频处理与逻辑推理上的综合实力,覆盖准确率、响应速度等多项指标。

在此次评测中,Step-Audio-R1.1 以 96.4% 的准确率击败 Grok、Gemini、GPT-Realtime 等多款顶级闭源模型,刷新了历史最好成绩。凭借性能与速度的均衡表现,Step-Audio-R1.1 脱颖而出,成为业内焦点。
这款模型具备强大的语音推理与实时响应能力,可端到端理解语音内容,几乎无额外延迟,实现“像人一样边听边想”。其最新版本进一步增强了实时对话和复杂语音推理能力,完整的实时语音 API 预计将于明年 2 月上线。目前,用户已可通过开放的聊天模式体验 R1.1 的核心能力,支持流式“边说边想”推理。
在发布会上,阶跃星辰展示了多个实际场景案例,例如辨析猫咪打斗的声音、理解韩语歌词等,充分体现了 Step-Audio-R1.1 的分析能力与语音理解深度,证明其在复杂语音环境中的稳定表现。
目前,Step-Audio-R1.1 的模型权重已上传至 HuggingFace,开发者与研究人员可免费下载与使用。同时,用户也可前往阶跃星辰开放平台体验中心进行试用。对于关注 AI 与语音技术的朋友来说,这是一次不容错过的机会。
huggingface:https://huggingface.co/stepfun-ai/Step-Audio-R1.1
划重点:
🌟 Step-Audio-R1.1 在国际评测中以 96.4% 准确率荣登全球第一!
📈 具备深度语音推理与实时响应,支持流式推理。
💻 模型可在 HuggingFace 免费获取,并可在开放平台在线体验。


















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?