阶跃星辰原生语音模型 Step-Audio-R1.1 夺得全球榜首

阶跃星辰公司宣布,其开源的原生语音推理模型 Step-Audio-R1.1 在国际知名的人工智能模型评测榜单中拿下第一。该榜单由 Artificial Analysis Speech Reasoning 发布,专注衡量语音模型在音频处理与逻辑推理方面的实力,覆盖准确率、响应时间等多项指标。

image.png

Step-Audio-R1.1 以 96.4% 的准确率,超越 Grok、Gemini、GPT-Realtime 等一线闭源模型,创下历史最好成绩。在性能与速度的综合评估中,Step-Audio-R1.1 表现强劲,成为行业关注的热点。

这款模型具备深度语音推理与实时响应能力,能够在几乎零延迟下端到端理解语音,实现“像人类一样,听到对话就开始思考”。其最新版本不仅增强了实时对话体验,还提升了复杂语音推理效果;完整的实时语音 API 计划于明年 2 月上线。目前,用户可在开放的聊天模式中体验 R1.1 的核心能力,支持边说边想的流式推理。

在发布会上,阶跃星辰展示了模型的实际应用,如分析猫咪争斗的声音与理解韩语歌词等案例,体现了 Step-Audio-R1.1 在复杂语音场景中的分析与理解水平。

目前,Step-Audio-R1.1 的权重已同步至 HuggingFace,开发者与研究人员可免费下载使用。用户也可前往阶跃星辰开放平台体验中心进行试用。对于关注 AI 与语音技术的朋友,这无疑是一个值得把握的机会。

huggingface:https://huggingface.co/stepfun-ai/Step-Audio-R1.1

划重点:  

🌟 Step-Audio-R1.1 在国际评测中以 96.4% 准确率拿下全球第一!  

📈 具备深度语音推理与实时响应,支持流式推理体验。  

💻 模型已在 HuggingFace 免费开放下载,并可在开放平台体验。  

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享