英伟达推新AI框架:8亿参数 Orchestrator 助力工具智能调度

近日,英伟达与香港大学团队推出名为“Orchestrator”的新模型,规模为8亿参数,能协调多种工具与大型语言模型(LLM)一起解决复杂问题。实验显示,Orchestrator 在工具使用类基准上以更低成本取得更高准确率,并可依据用户偏好智能挑选合适工具。

image.png

Orchestrator 通过名为 ToolOrchestra 的强化学习新框架训练,目标是让小模型担任“聪明协调者”。其核心思路是:用一个轻量级协调者统一管理多种专业模型与工具,相比单一庞大系统,更高效也更省成本。

当前常见做法,是把基础工具(如网络搜索、计算器)直接接到强力模型上。研究者认为,人类在推理时会借助多种外部资源,LLM 也应能与多工具互动。因此他们提出从单体模型走向复合系统:由协调者分析复杂任务、拆解子任务,并按需调用合适的工具。

基于 ToolOrchestra,研究团队训练并评估了 Orchestrator,在三个高难基准上进行测试。与多款通用大模型对比,Orchestrator 在博士级问题基准“HLE”上表现突出,同时计算成本显著更低。特别是在需要工具调用的场景下,它能合理安排不同工具的使用,在保持效率的同时减少对高成本模型的调用。

研究者表示,经过强化学习训练的 Orchestrator 具备很强的通用推理能力,能灵活应对新挑战。对企业应用而言,Orchestrator 还能适配未见过的模型与定价结构,为依赖多种 AI 模型的企业提供更经济、更灵活的方案。

项目:https://research.nvidia.com/labs/lpr/ToolOrchestra/

划重点:

🌟 Orchestrator 是一个8亿参数的小模型,可智能调度多种工具,增强 AI 的推理能力。

💡 ToolOrchestra 用强化学习把小模型训练成高效“协调者”,更好管理复杂任务。

🚀 Orchestrator 在多项基准中表现亮眼,明显降低计算成本,并能适配多样企业需求。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享