2026/2/18 10:59:39
网站建设
项目流程
怎么编写网站代码,如何网络推广运营,天眼查企业信息查询平台官网,建设学校网站的需求分析文献综述#xff08;围绕“LLM Agents 工作流编排/Orchestration”#xff09;
1#xff09;研究对象从“单个 Agent”走向“可组合的工作流系统”
从条目描述看#xff0c;2024–2025 年的研究明显把关注点从“一个更强的 agent”转向“多个 agent 多工具 多阶段流程如…文献综述围绕“LLM Agents × 工作流编排/Orchestration”1研究对象从“单个 Agent”走向“可组合的工作流系统”从条目描述看2024–2025 年的研究明显把关注点从“一个更强的 agent”转向“多个 agent 多工具 多阶段流程如何稳定运行”。这体现在三类工作工作流引擎/IR 与执行框架强调把任务表示成可执行结构如工作流图、工作流 IR并支持搜索、分解、修复与调度如 HALO、ALAS、iDDS、Murakkab、Jointλ 等条目所指向的能力。动态生成/自组织工作流由 LLM 根据目标和上下文生成多智能体工作流并在执行中自适应调整如“动态生成多智能体工作流”“自组织代理网络”“S-Agents”类条目。领域工作流产品化在法律、医疗、数据科学、DevOps、6G 运维等场景中把 agent 视为“流程节点/角色”把检索、推理、验证、写作、执行工具链整合为端到端系统法律多智能体 QA、临床决策、专利分析、AIOps 等条目。关键趋势研究重心变成“编排orchestration能力本身”——即如何将 LLM 的推理能力嵌入流程控制、依赖管理、资源调度、失败恢复与质量保证。2“Agentic AI / Web of Agents”把编排问题推向开放环境多条目提到Agentic Web、Web of Agents、互操作性协议、跨平台协调等这意味着系统从“封闭工具箱”走向跨系统、跨模型、跨组织的代理协作互操作协议、模型路由、跨平台任务管理更复杂的权限、身份、信任与治理问题尤其当 agent 能调用外部工具和数据源时。这类研究共同把“工作流编排”扩展为“生态级编排”不仅要安排步骤还要处理接口标准、通信协议、冲突协调与治理结构。3评估与基准从“回答对不对”走向“流程对不对、成本是否可控”你的清单中出现多种 bench/评估框架如 MCP-Bench、FedAgentBench、MedAgentBench、以及工作流引导规划基准等。这反映出评估维度升级工具使用与跨域流程能力能否正确选择工具、正确传参、正确串联多步骤可靠性与安全性监控恶意行为、工具调用风险、流程防火墙、工作流安全约束监控、AgentGuard、安全防火墙架构等效率与资源资源高效服务系统、调度优化、FaaS/跨云无状态编排等Murakkab、Jointλ、Gradientsys。结论LLM agent 的“效果”不再只是终端答案准确率而是“端到端工作流的可控性、可解释性、可复用性与成本”。4记忆、溯源与可复用让工作流“可累积”多条目直接指向“记忆/工作流记忆/溯源”工作流记忆学习、复用历史任务工作流以提升复杂任务表现AWM、LEGOMem 等。溯源模型统一追踪智能体交互、把自然语言转成结构化查询、支持审计与复现溯源参考架构、统一溯源模型条目。这些研究共同解决一个核心痛点当 agent 变成“流程型系统”你必须回答发生了什么trace为什么这么做rationale下次能不能复用workflow reuse5应用版图法律/医疗/科研自动化最突出从你的条目密度看应用最集中的方向是法律多智能体推理与检索协调提高问答可靠性法律工作流系统。医疗与生命科学治疗方案生成、临床决策支持、药物不良事件抽取、癌症免疫基因组学与免疫治疗设计平台等普遍强调“多工具、多阶段、可验证”的编排。科研自动化与科学发现实验协调器、智能实验室、地球科学发现加速、高能物理数据分析等呈现“代理编排科研流程”的共性需求。软件工程/DevOps/AIOps自愈流水线、运维流程、代码库自我演化、工作流故障排查FlowXpert等强调可执行与可回滚。综合讨论当前共识、主要缺口与可写的研究问题1当前共识从条目中可归纳编排核心能力任务分解、工具选择、步骤验证、失败恢复、资源调度逐渐成为与“推理”同等重要的系统能力。多智能体并非天然更好需要通过流程设计、冲突协调、监督机制如可视化监督、冲突解决才能稳定收益。评估必须流程化bench 开始强调工具链与端到端工作流而不是单轮对话。2主要缺口你的清单也反复触及但尚未“统一解决”互操作性与标准化不足协议/接口/消息规范仍在分散探索导致跨框架复用难。安全与治理仍是“附加模块”许多工作是提出防火墙/安全评估框架但与编排引擎的深度融合“默认安全”仍不足。可解释与可审计能力不统一溯源与记忆在发展但缺少“行业级通用 trace schema 评价指标”。成本-质量联合优化资源高效与质量保证往往分别讨论缺少统一的目标函数与策略搜索框架。3你可以直接落笔的研究问题按“智能体×编排”R1工作流表示IR/图/声明式如何影响 LLM 编排的可验证性与可迁移性R2多智能体协作的冲突检测与解决机制能否形成通用模式可视化监督/仲裁/角色重分配R3把安全约束编译进工作流policy-as-code是否优于事后监控如何评估R4基于溯源与工作流记忆的“流程复用”如何避免错误固化与分布漂移R5端到端评估如何同时覆盖正确性、稳健性、资源与合规多目标评估体系