2026/3/5 14:41:54
网站建设
项目流程
开源oa办公系统,天津网站seo策划,58推广网站建设有用吗,自己做网站需要缴费么小模型驱动大智能#xff1a;NVIDIA 新研究实现 2.5 倍效率提升#xff0c;成本直降 70% 论文标题#xff1a;ToolOrchestra: Elevating Intelligence via Efficient Model and Tool Orchestration
作者团队#xff1a;英伟达、香港大学
发布时间#xff1a;2025 年 11 …小模型驱动大智能NVIDIA 新研究实现 2.5 倍效率提升成本直降 70%论文标题ToolOrchestra: Elevating Intelligence via Efficient Model and Tool Orchestration作者团队英伟达、香港大学发布时间2025 年 11 月 27 日 一键直达论文Lab4AI 大模型实验室论文阅读⭐ 论文简介大语言模型在解决深度复杂问题时面临计算成本高、推理能力不足的挑战现有工具代理多依赖单一强大模型缺乏对“工具编排”的系统性优化导致效率与成本难以平衡。这篇论文解决的是训练一个小型语言模型Orchestrator 作为编排器动态协调多种工具基础工具、专业 LLMs、通用 LLMs通过强化学习优化任务完成效果。⭐ 核心创新论文核心是训练一个小型语言模型作为“编排器”通过强化学习让小模型学会 “何时调用、调用什么、如何组合” 工具实现 “以小控大、降本增效”。该方法将多工具任务建模为马尔可夫决策过程编排器通过“多轮滚动”交替执行“推理”和“工具调用”逐步完成任务。奖励设计包含三重目标结果正确性任务是否解决、效率成本与延迟、用户偏好工具选择倾向引导模型平衡性能与成本适配用户需求。为支持训练论文还提出了 ToolScale 数据集通过模拟工具环境与生成多样化任务解决端到端 RL 训练的数据稀缺问题。⭐ 论文的贡献提出“编排范式”用小型模型协调工具实现“性能 - 成本”最优发布 ToolScale 数据集推动工具代理研究证明小型编排模型在复杂任务上可超越大模型为低成本、可扩展的 AI 系统提供新思路。