AI 领域近期竞争升温。英伟达 4B 小模型 NVARC 在 ARC-AGI2最新测试中拿下 27.64%,超越对手 GPT-5Pro 的 18.3%,成功登顶。更关键的是,它的单任务成本仅约 20 美分,远低于 GPT-5Pro 的 7 美元,性价比可谓“性价比之王”。
NVARC 采用零预训练的深度学习思路,规避了依赖大规模通用数据集预训练带来的领域偏差与数据依赖问题。本次评测难度再次提升,ARC-AGI2 重点考察模型在没有直接训练数据的前提下,能否快速学习并掌握新技能。

为训练 NVARC,英伟达团队采取了创新策略:将复杂推理转移到离线合成数据管线,利用 GPT-OSS-120B 生成高质量合成谜题,从而降低在线计算消耗。团队从已有数据集中抽取问题,并通过组合产生更复杂的新题。为确保数据质量,他们把推理过程拆成多个可独立验证的阶段,最终构建出约 320 万条增强样本的合成数据集。
在推理模块上,NVARC 采用改进版 ARChitects,并借助对话式模板简化题意理解。训练过程中结合 NeMo RL 框架与 Megatron 后端进行监督微调。尤其是按任务进行快速微调的 TTFT 技术,使模型能迅速适配新的任务规则。
尽管有人质疑小模型是否只是“做题机器”,但 NVARC 的成绩恰恰证明了它在特定领域中的高适应性与高效率。小模型在成本、速度和部署适配上的优势,使其在许多应用场景更具吸引力。未来,把正确的方法用在合适的领域,将成为推动技术继续跃进的关键。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 2个月前0
粘贴不了啊用户12648782 3个月前0
用法杂不对呢?yfarer 3个月前0
草稿id无法下载,是什么问题?