中国第一:通义千问 3.5-Max-Preview 领跑国际竞技场

阿里通义千问大模型家族迎来重要升级。作为千问 3.5 系列的旗舰预览款,Qwen3.5-Max-Preview 正式登陆全球权威大模型评测平台 LM Arena,并以综合得分 1464 分创下新纪录。

image.png

排名跃升:稳居中国大模型榜首

在 LMSYS 组织的匿名盲测竞技场中,通义千问表现亮眼:

  • 全球位次:通义千问在总榜名列第 5,是中国阵营中排名最高的大模型。

  • 分项能力:数学能力位居全球第 5,专家级文本处理排在全球第 10。

  • 纯性能对比:在剔除风格控制因素后进行的绝对胜率比拼中,其整体实力达到全球第 6。

自农历除夕起,通义千问已密集开源 Qwen3.5 系列多款模型,快速搭建起完整的技术生态:

  • 参数覆盖:从 0.8B 到 397B 共 8 个规格,适配多类硬件场景,力求呈现顶尖表现。

  • 架构亮点:以 Qwen3.5-Plus 为例,采用 3970 亿总参数、170 亿激活参数的 MoE 架构,在功耗与性能之间取得良好平衡。

  • 持续演进:此次发布的 Max-Preview 旨在通过预览测试收集一线反馈,为正式版迭代打下基础。

凭借“模型匿名对战、全球开发者投票”的机制,LM Arena 被认为难以“刷榜”,且极具实战参考价值。通义千问本次登顶,意味着国产大模型在通用能力、逻辑推理与多语言理解方面,已正式迈入全球第一梯队。

目前,通义千问 3.5 系列已在阿里云百炼平台与开源社区全面上线,持续助力各行业推进 AI 应用的深度落地。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞5 分享