阿里 Qwen3-Max-Thinking 全球数学赛满分，挑战 OpenAI 的领先地位-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

近日，阿里巴巴集团发布升级版 AI 推理模型——Qwen3-Max-Thinking。该模型在两项全球顶级数学竞赛中拿下满分，展现强大的推理与解题实力。它成为首个在美国邀请数学考试（AIME）与哈佛-麻省理工数学锦标赛（HMMT）中达到 100% 准确率的中国 AI 推理模型。

通义 Qwen (1)

图源备注：图片由AI生成

AIME 与 HMMT 被认为是全球最具挑战性的数学赛事之一，考查选手在算术、代数、数论、概率等方面的综合能力。来自圣荷西的 AI 软件公司 Intuition Labs 指出，数学推理高分是评估 AI 模型思考与解决问题能力的关键指标。这些竞赛成为 AI 进步的重要前沿，体现了更强推理模型的激烈竞争。

Qwen3-Max-Thinking 是阿里云推出的 Qwen3-Max 系列中的最新版本，参数规模超过 1 万亿。Qwen3-Max 于 9 月底发布，初代 Qwen3 则在 4 月亮相。阿里云在发布会上表示，Qwen3-Max 在国内外多款竞品中表现突出，包括 Anthropic 的 Claude Opus4、DeepSeek 的 V3.1、xAI 的 Grok4 以及 OpenAI 的 GPT-5Pro。

值得一提的是，Qwen3-Max 在一次真实市场实验中也表现亮眼：与来自中美的五个领先 AI 系统同场进行加密货币交易，连续两周实现 22.3% 的投资回报；其他模型表现平平，其中 OpenAI 的 GPT-5 更是出现了 62.7% 的亏损。

目前，Qwen3-Max-Thinking 已通过 Qwen 聊天机器人网页版与阿里云 API 面向个人用户开放。Qwen 团队研究员林俊扬在社交媒体透露，团队仍在持续改进这款新推理模型，相关工作尚未完成。

划重点:

– 📊 阿里巴巴的 Qwen3-Max-Thinking 在国际数学竞赛中拿满分，直面挑战 OpenAI。

– 🏆 模型参数超过 1 万亿，是首个在 AIME 与 HMMT 达到 100% 准确率的中国 AI。

– 📈 Qwen3-Max 在真实市场的加密货币交易测试中表现优异，取得 22.3% 的回报。