英伟达推新AI框架：8亿参数 Orchestrator 助力工具智能调度-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

近日，英伟达与香港大学团队推出名为“Orchestrator”的新模型，规模为8亿参数，能协调多种工具与大型语言模型（LLM）一起解决复杂问题。实验显示，Orchestrator 在工具使用类基准上以更低成本取得更高准确率，并可依据用户偏好智能挑选合适工具。

Orchestrator 通过名为 ToolOrchestra 的强化学习新框架训练，目标是让小模型担任“聪明协调者”。其核心思路是：用一个轻量级协调者统一管理多种专业模型与工具，相比单一庞大系统，更高效也更省成本。

当前常见做法，是把基础工具（如网络搜索、计算器）直接接到强力模型上。研究者认为，人类在推理时会借助多种外部资源，LLM 也应能与多工具互动。因此他们提出从单体模型走向复合系统：由协调者分析复杂任务、拆解子任务，并按需调用合适的工具。

基于 ToolOrchestra，研究团队训练并评估了 Orchestrator，在三个高难基准上进行测试。与多款通用大模型对比，Orchestrator 在博士级问题基准“HLE”上表现突出，同时计算成本显著更低。特别是在需要工具调用的场景下，它能合理安排不同工具的使用，在保持效率的同时减少对高成本模型的调用。

研究者表示，经过强化学习训练的 Orchestrator 具备很强的通用推理能力，能灵活应对新挑战。对企业应用而言，Orchestrator 还能适配未见过的模型与定价结构，为依赖多种 AI 模型的企业提供更经济、更灵活的方案。

项目:https://research.nvidia.com/labs/lpr/ToolOrchestra/

划重点:

🌟 Orchestrator 是一个8亿参数的小模型，可智能调度多种工具，增强 AI 的推理能力。

💡 ToolOrchestra 用强化学习把小模型训练成高效“协调者”，更好管理复杂任务。

🚀 Orchestrator 在多项基准中表现亮眼，明显降低计算成本，并能适配多样企业需求。