腾讯自研大模型混元2.0(Tencent HY2.0)已正式亮相;同时,DeepSeek V3.2 正在逐步接入腾讯生态。当前,这两款模型已率先登陆元宝、ima 等腾讯AI原生应用,腾讯云也同步开放相关模型的API与平台服务。
本次发布的 Tencent HY2.0 采用混合专家(MoE)架构,总参数规模达406B(激活参数32B),支持256K超长上下文窗口,其推理表现与效率处于业内领先水平。

相较上一版本(Hunyuan-T1-20250822),HY2.0Think 在预训练数据与强化学习策略上实现了明显升级。在数学、科学、代码与指令遵循等复杂推理场景中,整体表现稳居国内第一梯队,泛化能力也得到显著增强。
在数理知识推理方面,HY2.0Think 借助高质量数据进行 Large Rollout 强化学习,推理能力进一步提升。在国际数学奥林匹克竞赛(IMO-AnswerBench)与哈佛MIT数学竞赛(HMMT2025)等权威评测中取得优异成绩。结合预训练数据的进步,模型在高度考验知识水平的 Humanitys Last Exam(HLE)与强调泛化的 ARC AGI 等任务上同样实现大幅提升。

在指令遵循与长文多轮交互方面,HY2.0Think 通过重要性采样修正缓解了训练与推理阶段的不一致,达成长窗口RL的高效稳定训练。配合多样且可验证的任务沙盒与基于评分准则的强化学习,模型在 Multi Challenge 等指令与多轮任务中的效果显著提升。
在代码与智能体能力上,腾讯构建了规模化可验证环境与高质量合成数据,显著强化了模型在 Agentic Coding 与复杂工具调用场景的落地能力。在面向真实应用的 SWE-bench Verified 与 Tau2-Bench 等智能体评测中,模型实现了跃升。


















用户38505528 2个月前0
粘贴不了啊用户12648782 3个月前0
用法杂不对呢?yfarer 3个月前0
草稿id无法下载,是什么问题?