英伟达4B小模型登顶:单任务成本仅为 GPT-5 Pro 的 1/36

AI 领域近期竞争升温。英伟达 4B 小模型 NVARC 在 ARC-AGI2最新测试中拿下 27.64%,超越对手 GPT-5Pro 的 18.3%,成功登顶。更关键的是,它的单任务成本仅约 20 美分,远低于 GPT-5Pro 的 7 美元,性价比可谓“性价比之王”。

NVARC 采用零预训练的深度学习思路,规避了依赖大规模通用数据集预训练带来的领域偏差与数据依赖问题。本次评测难度再次提升,ARC-AGI2 重点考察模型在没有直接训练数据的前提下,能否快速学习并掌握新技能。

image.png

为训练 NVARC,英伟达团队采取了创新策略:将复杂推理转移到离线合成数据管线,利用 GPT-OSS-120B 生成高质量合成谜题,从而降低在线计算消耗。团队从已有数据集中抽取问题,并通过组合产生更复杂的新题。为确保数据质量,他们把推理过程拆成多个可独立验证的阶段,最终构建出约 320 万条增强样本的合成数据集。

在推理模块上,NVARC 采用改进版 ARChitects,并借助对话式模板简化题意理解。训练过程中结合 NeMo RL 框架与 Megatron 后端进行监督微调。尤其是按任务进行快速微调的 TTFT 技术,使模型能迅速适配新的任务规则。

尽管有人质疑小模型是否只是“做题机器”,但 NVARC 的成绩恰恰证明了它在特定领域中的高适应性与高效率。小模型在成本、速度和部署适配上的优势,使其在许多应用场景更具吸引力。未来,把正确的方法用在合适的领域,将成为推动技术继续跃进的关键。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞5 分享