门户网站建设统计表天津建设工程信息网怎么登录
2026/4/12 23:30:17 网站建设 项目流程
门户网站建设统计表,天津建设工程信息网怎么登录,网站建设在哪能看,php 5.2.17 wordpress文章介绍了AI Agent中的Plan and Execute(PE)模式#xff0c;通过先计划#xff0c;再执行的思想解决了ReAct模式在长任务中面临的上下文膨胀和目标偏移问题。PE将系统拆分为规划、执行和监控三层架构#xff0c;使模型先生成高层次计划#xff0c;再…文章介绍了AI Agent中的Plan and Execute(PE)模式通过先计划再执行的思想解决了ReAct模式在长任务中面临的上下文膨胀和目标偏移问题。PE将系统拆分为规划、执行和监控三层架构使模型先生成高层次计划再逐步执行减轻单次执行负担提高系统稳定性。特别适用于任务链路长、约束多、失败成本高的场景虽会增加复杂度但能显著提升系统在复杂任务中的表现。前言在前两篇中我们已经比较系统地梳理了 AI Agent 的发展历程也对 AI Agent 和 AI Workflow 之间的区别做过一次完整的拆解同时重点讲解了目前最经典、也是被讨论最多的 ReAct 模式。这一篇我们继续介绍另一个在工程实践中同样非常重要、并且经常和 ReAct 搭配使用的模式Plan and Execute简称 PE。PE 的核心思想其实并不复杂本质就是一句话先计划再执行。但正是这一步先计划在很多真实场景中往往会决定一个 Agent 系统最终能不能跑通。如果你实际用过 ReAct就会很容易遇到一个问题一个标准的 ReAct Agent几乎在每一轮都会把整个任务的执行过程和执行结果重新喂回给模型从而让模型始终持有完整的上下文。这个机制在短任务中非常好用但当任务本身无法在几步之内完成时上下文就会持续膨胀尤其是在涉及文件读写、长文本处理或者多轮工具调用的情况下这种膨胀几乎是不可避免的。从表面上看模型的上下文窗口已经越来越大128k 早已不是极限200k 甚至 1M 的模型也已经出现。但在工程实践中一个很现实的问题是上下文变大并不会线性提升效果反而在很多情况下会让模型更容易偏离最初的目标。当上下文中无关信息的比例不断上升时信噪比会明显下降模型对早期约束的关注度会逐渐被稀释从而更容易出现目标偏移、遗漏约束甚至产生不必要的幻觉。因此在实际系统中通常会尽量将单轮上下文控制在一个相对安全的范围内例如 100k 左右?避免无限逼近模型的上下文上限。除了上下文规模的问题在面对复杂任务、强约束任务时ReAct 还存在一个常见的问题对长期目标和多重约束的保持能力不足。比如下面这个需求本身并不模糊甚至可以说写得非常清楚请为我制定一份7天6晚的山水主题旅游计划包含往返交通总预算严格控制在10000元以内。 目的地需具备明显的山水景观并避开旅游高峰期请说明该地的最佳出行时间及是否需避开节假日。 行程安排需详细到每日景点顺序、活动建议与交通衔接合理融合自然与人文体验。 同时请结合目的地气候提供1月的温湿度、降水概率及相应穿衣指南介绍当地重要的文化习俗、礼仪禁忌与特色美食并给出预算分项估算、住宿区域建议、必备物品及安全提示。 希望整体计划注重可操作性并适当体现地方特色。上面这个可以说是一个非常完整的提示词但如果你真的让一个单 Agent、基于 ReAct 的模型去完整执行这个任务执行到后半段时往往会发现它开始只关注“最近正在生成的内容”而对前面提出的一些硬约束比如预算上限、时间避峰、文化禁忌等逐渐变得不那么敏感。最终的结果通常不是完全错误而是只满足了一部分要求。这里需要强调的是这并不是 ReAct 本身的问题而是当一个 Agent 同时承担全局目标管理和具体执行这两种职责时在长链路任务中很容易顾此失彼。这一点其实和我们自己做项目非常像。如果你接到一个稍微复杂一点的需求一上来就直接开始写代码哪怕经验再丰富做到后面也很容易发现有些功能漏了、有些约束没对齐甚至前后端和产品的理解并不完全一致。所以在真实的开发过程中我们往往会先做一些看似“很浪费时间”的事比如列 TODO、写方案、拆阶段目标把整个任务先在脑子里走一遍。PE 模式本质上就是把这种人类项目管理式的思考方式显式地引入到了 Agent 系统中。在 PE 中我们不再指望一个 Agent 从头到尾既想清楚全局、又把所有细节一次性做好而是先让模型生成一份明确的执行计划然后再让执行 Agent 按计划逐步完成。每一次执行只需要关注当前这个子目标而不需要同时背负所有约束。这也是 PE 能够在长任务中显著提升稳定性的根本原因。需要提前说明的一点是PE 本质上是一种控制和编排模式而不是必须使用多个 Agent。你完全可以用同一个模型通过不同的 system prompt 来分别扮演 Planner 和 Executor是否拆成多 Agent更多是工程层面的选择而不是模式本身的前提。当然PE 也不是没有代价。对于非常简单的任务引入规划阶段本身就是额外开销不管是 token 消耗还是系统复杂度都会比直接用 ReAct 更高。因此它更适合用在那些任务链路长、约束多、失败成本高的场景中。Plan And Execute 模式核心思想这张图来自 LangChain 博客对 Plan and Execute 模式给出了一个非常工程化的抽象。从流程上看它并没有试图强调模型怎么思考而是把注意力放在任务是如何在不同阶段之间流转的用户问题先进入规划阶段被拆解成一组明确的步骤随后这些步骤被依次交给执行模块处理执行过程中持续产生中间结果并由上层进行监控一旦某一步失败就会触发重新规划再次回到 Plan 阶段。我个人比较喜欢这张图的一点在于它几乎完全是从系统视角出发的。你可以把它理解成一条控制流而不是一段 Prompt 技巧。它回答的不是模型该怎么想而是一个复杂任务在系统中应该如何被组织和调度。在实际工程中这种视角往往比单纯讨论 prompt 更有价值。相比之下PE 论文中的这张图关注点就不太一样了。它并不是在强调系统流程而是在强调Plan 本身的作用。图中可以看到模型并不是一开始就直接进入逐步推理或执行而是先生成一个高层次的计划结构然后再围绕这个计划逐步完成任务。这张图想表达的核心其实是通过显式的规划阶段把原本隐含在模型推理过程中的全局结构提前抽象出来从而减少执行阶段的负担。执行模型不需要时刻记住所有目标只需要在当前步骤下把事情做好即可。这也是为什么 PE 在长任务、强约束任务中往往比单纯依赖逐步推理的方式更加稳定。如果说前一张图更像是在描述系统怎么跑那这张图更像是在回答为什么要先规划。核心实现三层架构设计在工程实现上PE 通常可以抽象为三个角色规划、执行和监控。规划阶段负责生成一份高层次的 TODO 列表它只关心要完成什么而不关心具体怎么做执行阶段负责完成每一个具体步骤可以使用 ReAct也可以使用其他形式的 Agent监控阶段则负责判断执行是否成功并在失败时触发重规划。通过下面这段伪代码可以清晰地体现这一点Plan Agent 只负责生成计划Execute Agent 专注于执行当前步骤而在失败时会把失败上下文重新交给 Planner让它生成一份新的、完整的计划。//1. 规划层 - 生成蓝图 asyncfunctiongeneratePlan(task){// 提示词强调做什么而不是怎么做const prompt你是一位项目经理请将任务分解为3-6个可执行的步骤。 任务${task}要求 - 每个步骤描述要达到的目标 - 不要描述具体实现细节 - 步骤间有逻辑顺序 输出格式{steps:[{step:描述}]};returnawait llmGenerate(prompt);}//2. 执行层 - 执行每个步骤可用ReAct asyncfunctionexecuteStep(step){// 对每个步骤使用ReAct执行returnawait runReAct({task: step.step});}//3. 监控层 - 处理失败和重规划 asyncfunctionmonitorExecution(plan, results){for(let i0;iplan.steps.length;i){const resultresults[i];if(result.failed){// 触发重规划 const newPlanawait replan({originalTask, failedStep: plan.steps[i], failureReason: result.error, completedSteps: results.slice(0, i)});// 用新计划重新开始returnawait executePlan(newPlan);}}}重规划机制详解RePlan 并不是简单地再生成一次计划而是一次基于当前状态的条件规划。一个有效的 RePlan至少需要考虑以下信息哪些步骤已经成功完成、当前失败的具体步骤是什么、失败的原因或异常信息、是否需要改变执行顺序或策略等等否则模型很容易生成一个看似不同、实则重复失败路径的新计划。asyncfunctionreplan(context){const prompt原任务${context.originalTask}执行情况 - 已完成${context.completedSteps.length}个步骤 - 失败步骤${context.failedStep.step}- 失败原因${context.failureReason}请生成新的计划避免同样的失败。;// LLM会分析失败原因调整后续步骤 const newPlanawait llmGenerate(prompt);return{...newPlan, // 保留已成功的步骤 completedSteps: context.completedSteps};}具体实现下面这份代码是一个简化但逻辑完整的 PE Agent 实现。但这里的实现更多是为了说明 PE 的整体结构而不是一个可以直接在生产环境使用的最终方案。在真实系统中通常还需要对重规划次数、token 预算以及最终 Summary 阶段的幻觉风险进行更严格的控制。不过即便如此这个实现已经完整覆盖了 PE 的核心流程也很好地展示了 Planner、Executor 和 RePlanner 之间的职责边界。PE 主逻辑import{llmGenerate}from../llm/provider.js;import{runReAct}from./react-agent.js;const SYSTEMYou are a professional Plannerina Plan-and-Execute agent architecture. Your responsibility is to analyze the users task and produce a clear, minimal, and executable high-level plan. Rules and constraints: - You ONLY generate the plan. YoudoNOT execute any step. - You MUST NOT call tools or mention tool names. - You MUST NOT describe implementation details or low-level actions. - Each step should describe WHAT needs to be achieved, not HOW it is done. - Steps must be logically ordered and independent when possible. - Prefer fewer, clearer steps(3–6 steps). - Each step should be actionable, unambiguous, and verifiable by an executor. Outputformat(strict JSON only):{steps:[{step:...}]}Do not include any explanation, commentary, or extra text outside the JSON.;exportasyncfunctionplanAndExecute({task, options{}, replanOnFailuretrue, availableTools,}{}){const{text}await llmGenerate({system: SYSTEM, prompt:Task: ${task},});letplan;try{planJSON.parse(text);console.log(Plan:\n, plan);}catch(e){return{final:Plan parse failed, error: String(e), raw: text};}const trace[];for(const[idx, s]of plan.steps.entries()){const reactResawait runReAct({task: s.step, maxLoops:10});const observationreactRes.final ?{ok: true, message: reactRes.final}:{ok: false, error:No final from ReAct};trace.push({idx: idx 1, step: s.step, observation, reactTrace: reactRes.trace,});if(replanOnFailure!observation.ok){const replanPromptOriginal task: ${task}The previous plan failed. Failure details: - Failed step index: ${idx 1}- Failed step description: ${s.step}- Observation at failure: ${JSON.stringify(observation)}Execution trace so far: ${JSON.stringify(reactRes.trace||[])}Your task: Generate a revised plan that resolves the failure and allows the task to complete successfully. Output requirements: - Respond with a single valid JSON object only - Do NOT include any explanations, comments, or Markdown - The JSON must represent a complete revised plan, not a partial patch - The revised plan must avoid repeating the failed stepinthe same form Return JSON only.;const{text: newPlanText}await llmGenerate({system: SYSTEM, prompt: replanPrompt,});try{const newPlanJSON.parse(newPlanText);plannewPlan;console.log(New Plan:\n, newPlan);returnawait planAndExecute({task, options, replanOnFailure, availableTools,});}catch(e){trace.push({idx: idx 1, step:REPLAN_FAILED, error: String(e), raw: newPlanText,});}}}const summaryPromptGiven the plan execution trace, summarize final resultfortask: ${task}.\nTRACE:\n${JSON.stringify(trace, null,2)};const{text: final}await llmGenerate({system:Summarizer, prompt: summaryPrompt,});return{final, plan, trace};}结语这篇文章里介绍的 PE 模式本质上并不是某种 更高级 的 Agent而是我们在工程实践中为了解决长任务和复杂约束问题总结出来的一种更稳妥的组织方式。不同的模式并不存在绝对的优劣更多是取决于你面对的是什么样的问题。原本我是打算下一篇继续写 Reflexion 模式的但最近有一些其他事情要做也有一些目前更感兴趣的方向比如 Spec Coding、Agent Skill、Mem0 这一类的技术再加上 25 年 Qwen 团队在 NeurIPS 上获得最佳论文的关于门控注意力机制的研究也都值得花时间去看一看。Agent 这条线本身还远没有收敛到一个稳定范式有太多东西值得慢慢拆、慢慢写所以这部分内容就先告一段落后面有时间再继续展开。上面的实现代码已经开源在 GitHub可以下载到本地进行运行调试 https://github.com/Alessandro-Pang/agent-desgin-pattern-demo如何学习大模型 AI 由于新岗位的生产效率要优于被取代岗位的生产效率所以实际上整个社会的生产效率是提升的。但是具体到个人只能说是“最先掌握AI的人将会比较晚掌握AI的人有竞争优势”。这句话放在计算机、互联网、移动互联网的开局时期都是一样的道理。我在一线科技企业深耕十二载见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事早已在效率与薪资上形成代际优势我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套AI 大模型突围资料包✅ 从零到一的 AI 学习路径图✅ 大模型调优实战手册附医疗/金融等大厂真实案例✅ 百度/阿里专家闭门录播课✅ 大模型当下最新行业报告✅ 真实大厂面试真题✅ 2025 最新岗位需求图谱所有资料 ⚡️ 朋友们如果有需要《AI大模型入门进阶学习资源包》下方扫码获取~① 全套AI大模型应用开发视频教程包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点② 大模型系统化学习路线作为学习AI大模型技术的新手方向至关重要。 正确的学习路线可以为你节省时间少走弯路方向不对努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划带你从零基础入门到精通③ 大模型学习书籍文档学习AI大模型离不开书籍文档我精选了一系列大模型技术的书籍和学习文档电子版它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。④ AI大模型最新行业报告2025最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。⑤ 大模型项目实战配套源码学以致用在项目实战中检验和巩固你所学到的知识同时为你找工作就业和职业发展打下坚实的基础。⑥ 大模型大厂面试真题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我精心整理了一份大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。以上资料如何领取为什么大家都在学大模型最近科技巨头英特尔宣布裁员2万人传统岗位不断缩减但AI相关技术岗疯狂扩招有3-5年经验大厂薪资就能给到50K*20薪不出1年“有AI项目经验”将成为投递简历的门槛。风口之下与其像“温水煮青蛙”一样坐等被行业淘汰不如先人一步掌握AI大模型原理应用技术项目实操经验“顺风”翻盘这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。以上全套大模型资料如何领取

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询