阶跃星辰公司宣布,其开源的原生语音推理模型 Step-Audio-R1.1 在国际知名的人工智能模型评测榜单中拿下第一。该榜单由 Artificial Analysis Speech Reasoning 发布,专注衡量语音模型在音频处理与逻辑推理方面的实力,覆盖准确率、响应时间等多项指标。

Step-Audio-R1.1 以 96.4% 的准确率,超越 Grok、Gemini、GPT-Realtime 等一线闭源模型,创下历史最好成绩。在性能与速度的综合评估中,Step-Audio-R1.1 表现强劲,成为行业关注的热点。
这款模型具备深度语音推理与实时响应能力,能够在几乎零延迟下端到端理解语音,实现“像人类一样,听到对话就开始思考”。其最新版本不仅增强了实时对话体验,还提升了复杂语音推理效果;完整的实时语音 API 计划于明年 2 月上线。目前,用户可在开放的聊天模式中体验 R1.1 的核心能力,支持边说边想的流式推理。
在发布会上,阶跃星辰展示了模型的实际应用,如分析猫咪争斗的声音与理解韩语歌词等案例,体现了 Step-Audio-R1.1 在复杂语音场景中的分析与理解水平。
目前,Step-Audio-R1.1 的权重已同步至 HuggingFace,开发者与研究人员可免费下载使用。用户也可前往阶跃星辰开放平台体验中心进行试用。对于关注 AI 与语音技术的朋友,这无疑是一个值得把握的机会。
huggingface:https://huggingface.co/stepfun-ai/Step-Audio-R1.1
划重点:
🌟 Step-Audio-R1.1 在国际评测中以 96.4% 准确率拿下全球第一!
📈 具备深度语音推理与实时响应,支持流式推理体验。
💻 模型已在 HuggingFace 免费开放下载,并可在开放平台体验。

















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?