近日,阿里巴巴集团发布升级版 AI 推理模型——Qwen3-Max-Thinking。该模型在两项全球顶级数学竞赛中拿下满分,展现强大的推理与解题实力。它成为首个在美国邀请数学考试(AIME)与哈佛-麻省理工数学锦标赛(HMMT)中达到 100% 准确率的中国 AI 推理模型。

图源备注:图片由AI生成
AIME 与 HMMT 被认为是全球最具挑战性的数学赛事之一,考查选手在算术、代数、数论、概率等方面的综合能力。来自圣荷西的 AI 软件公司 Intuition Labs 指出,数学推理高分是评估 AI 模型思考与解决问题能力的关键指标。这些竞赛成为 AI 进步的重要前沿,体现了更强推理模型的激烈竞争。
Qwen3-Max-Thinking 是阿里云推出的 Qwen3-Max 系列中的最新版本,参数规模超过 1 万亿。Qwen3-Max 于 9 月底发布,初代 Qwen3 则在 4 月亮相。阿里云在发布会上表示,Qwen3-Max 在国内外多款竞品中表现突出,包括 Anthropic 的 Claude Opus4、DeepSeek 的 V3.1、xAI 的 Grok4 以及 OpenAI 的 GPT-5Pro。
值得一提的是,Qwen3-Max 在一次真实市场实验中也表现亮眼:与来自中美的五个领先 AI 系统同场进行加密货币交易,连续两周实现 22.3% 的投资回报;其他模型表现平平,其中 OpenAI 的 GPT-5 更是出现了 62.7% 的亏损。
目前,Qwen3-Max-Thinking 已通过 Qwen 聊天机器人网页版与阿里云 API 面向个人用户开放。Qwen 团队研究员林俊扬在社交媒体透露,团队仍在持续改进这款新推理模型,相关工作尚未完成。
划重点:
– 📊 阿里巴巴的 Qwen3-Max-Thinking 在国际数学竞赛中拿满分,直面挑战 OpenAI。
– 🏆 模型参数超过 1 万亿,是首个在 AIME 与 HMMT 达到 100% 准确率的中国 AI。
– 📈 Qwen3-Max 在真实市场的加密货币交易测试中表现优异,取得 22.3% 的回报。

















用户38505528 1个月前0
粘贴不了啊用户12648782 2个月前0
用法杂不对呢?yfarer 2个月前0
草稿id无法下载,是什么问题?