2025/12/28 12:58:37
网站建设
项目流程
河南炒股配资网站开发,教育网站建设方案模板,楚雄企业网站建设公司,做门窗的建网站怎么赚钱如果说第一课回答了“为什么大家突然都在谈 Agent”#xff0c;那第 2 课要解决的是一个更关键的问题#xff1a;Agent 到底是怎么搭出来的#xff1f;很多人一上来就学 LangChain、AutoGen、CrewAI#xff0c;结果看了一堆概念#xff1a;Tool、Memory、Planner、Router、…如果说第一课回答了“为什么大家突然都在谈 Agent”那第 2 课要解决的是一个更关键的问题Agent 到底是怎么搭出来的很多人一上来就学 LangChain、AutoGen、CrewAI结果看了一堆概念Tool、Memory、Planner、Router、RAG、Workflow……越看越像“咒语”。其实它们并不神秘绝大多数 Agent 系统都能被拆成一套相对稳定的“标准零件”。这节课我们用五层架构把Agent拆开讲清楚LLM 层、工具层、记忆层、控制层、接入层。你掌握这五层就能反过来“读懂”任何 Agent 框架它解决了哪几层缺了哪几层为什么有的Demo看起来很聪明有的却一跑就翻车一、先把“Agent”画成一个闭环Agent 的本质不是“会说话”而是一个能持续运行的闭环系统输入目标 → 观察环境 → 规划/决策 → 执行动作调用工具→ 得到反馈 → 更新状态 → 继续下一步直到完成。如果你把 ChatGPT 当成“大脑”那么 Agent 要补齐的至少还有手工具/执行能力记忆长期信息、任务状态中枢神经控制与调度让循环能跑起来感官与接口把真实世界接进来文件、网页、业务系统五层架构正是把这些能力工程化的方式。二、五层架构总览你以后看框架就用这张“地图”我们把一个典型 Agent 系统拆成五层LLM 层负责理解、推理、生成结构化输出计划/动作/总结工具层Tools负责“真正做事”搜索、数据库、代码执行、发请求、写文件记忆层Memory负责“记住什么”和“如何取用”短期上下文 长期存储 知识检索控制层Controller / Orchestrator负责“让闭环跑起来”循环、状态机、路由、多 Agent 协作、容错接入层Interface / Integration负责“接到哪里去”网页端、企业 IM、浏览器插件、业务系统、权限/审计你可以把它理解为LLM 决定做什么工具层负责怎么做记忆层保存做过什么、学到什么控制层决定什么时候做、做几步、失败怎么办接入层把能力交付给用户与系统接下来逐层讲做到“能落地、能写代码、能做设计”。三、LLM 层不是“聊天”而是“可控的推理与结构化输出”在 Agent 中LLM 的常见职责有三类1任务理解Intent把用户一句话变成明确目标与约束。例如“帮我写周报” → 周报周期团队项目格式数据从哪里来2规划Plan把目标拆解成可执行步骤。注意规划不等于输出一段“看起来很合理的流程”而是要能映射到工具调用。3决策与动作选择Action SelectionAgent 往往需要 LLM 输出结构化动作例如 JSONaction: search_docs args: {query: ..., time_range: week}这样控制层才能解析并执行。教学提示为什么要结构化因为“自然语言”不可控你无法稳定解析你无法保证字段齐全你无法做权限校验与审计因此Agent 里常用的输出形态是Plan / Action / Final 三段式或统一的动作 JSON。四、工具层Agent 的“手”决定上限工具层是Agent真正价值爆发的地方没有工具调用就没有执行力。常见工具类型可以分成四组信息获取类Web 搜索、内部知识库检索、爬取页面数据访问类数据库查询、数据仓库、BI 接口、表格系统生产操作类写文档、发邮件、创建工单、更新项目状态、提交代码计算执行类Python 运行、SQL 执行、模型推理、图表生成工具设计的三个关键原则原则 A工具要“窄而稳”不要做一个“万能工具”而是做“可预测的小工具”get_weekly_tasks()、 query_sales(date_range)、 update_notion_page(page_id, content)越窄越好测试、越好权限控制。原则 B工具输入输出要强类型哪怕你不用严格的类型系统也要在工程上保持一致输入字段固定输出结构固定错误码明确原则 C工具要有“安全边界”尤其是能写文件、发邮件、改数据库的工具增加确认机制dry-run/二次确认增加权限与审计谁在何时改了什么增加速率限制避免死循环造成灾难五、记忆层不是“把聊天记录存起来”这么简单记忆层负责三件事存什么、怎么存、怎么取。1短期记忆上下文窗口短期记忆通常是对话历史与当前任务状态。工程上要解决“太长了放不下”的问题摘要summary关键事实表facts任务进度表todo / done / next2长期记忆用户偏好与历史例如你写周报的固定模板常用称谓与口吻你所在团队的项目列表 这些信息不该每次都问一遍。3知识记忆RAG / 检索增强企业里最常见把制度、产品文档、会议纪要放进可检索系统。注意这类记忆不是“记住”而是“能随时查到”。教学提示记忆层最常见的坑把所有内容都塞进长期记忆 → 垃圾堆越记越乱不做“可追溯引用” → 业务问答不可信不区分“事实”与“推测” → 产生错误沉淀一个实用做法是长期记忆只存“稳定偏好与身份信息”知识事实走 RAG并保留引用来源任务过程走短期状态可随任务结束清理六、控制层Agent 的“中枢”决定稳定性与可控性很多Demo看起来“会自己做事”核心就在控制层它让系统按规则循环而不是让模型自由发挥到失控。控制层通常包含1Agent Loop循环一个最小闭环大概是读取目标与当前状态让 LLM 产出下一步动作或计划执行工具把结果写回状态并可能写入记忆判断是否完成否则继续在工程上你要加两个硬约束最大步数例如最多 8 步终止条件达到目标、无法继续、需要人工介入2路由Router当任务类型不同应该走不同策略问答 → RAG 优先数据拉取 → 先查数据库再写报告写代码 → 进入“生成-运行-报错-修复”循环路由可以由规则做也可以由 LLM 进行分类但务必可观测、可回放。3多 Agent 协作企业级常见做法是“分工”需求分析 Agent数据收集 Agent产出撰写 Agent校对/合规 Agent多 Agent 的价值在于降低单个模型的上下文负担让每个角色更专注。但它也带来协调成本因此控制层要负责任务分配结果汇总冲突解决多个 Agent 给出不同结论怎么办4容错与回滚真实系统里一定会失败接口超时、权限不足、数据为空。控制层要做重试策略指数退避、换工具降级策略只输出建议、不执行写操作人工接管点需要批准才继续七、接入层决定你的 Agent 能不能“进组织、进流程”接入层解决的是“交付形态”你把 Agent 放在网页飞书/企业微信IDE 插件浏览器如何做登录、权限、审计如何与现有系统对接OA、CRM、工单、知识库接入层常见能力身份与权限不同人能调用不同工具审计与日志每一步动作可回放谁让它改了什么人机协同 UI在关键节点请求确认尤其写操作异步任务周报/报表类任务可能需要 10 分钟跑完要能后台执行并通知很多Agent在 Demo 阶段很酷落地失败往往是因为接入层没做好没有权限体系没有审计业务系统不敢给它“写”的能力。八、把五层用一个“自动写周报 Agent”串起来我们拿思考题做示例自动写周报 Agent 需要哪些工具哪些是记忆哪些是行动1它需要的工具Tools最核心通常是“取数 产出 分发”三类任务数据Jira/飞书项目/禅道/Notion 的任务查询工具沟通记录会议纪要、IM 摘要可选需权限数据指标数据库/BI 查询销售、DAU、转化等文档生成写入周报模板Notion/飞书文档/Google Docs分发通知发邮件/发 IM 给主管最好带确认2哪些信息属于“记忆”Memory你的周报模板偏好标题结构、口吻、长度团队项目与简称“A 项目Phoenix 重构”固定收件人/汇报对象你不希望出现的内容例如不写加班、不过度承诺这些信息稳定且复用适合长期记忆。3哪些属于“行动”Action拉取本周任务清单汇总完成项、进行中、风险项查关键指标并生成图表可选写入文档并生成链接请求你确认后发送给主管行动的特点是会改变外部世界或产生可交付物必须可审计、可回滚。九、本课小结你已经掌握了“看懂 Agent”的钥匙到这里你应该能做到两件事看到任何 Agent 产品/框架都能用五层去拆它的工具怎么接记忆怎么做控制层怎么防死循环接入层怎么审计开始用工程视角设计 Agent不是“让模型更聪明”而是让系统更可控、更能执行、更能进入组织流程。下一课我们会进入真正的“动手环节”从零实现一个最小可用的 Agent Loop带工具调用 状态管理 终止条件并且用“自动写周报”做一个可扩展的Demo骨架。本课练习选一个你熟悉的业务场景例如投放日报、客服质检、招聘筛选按五层写一页设计每层需要什么列出你愿意开放给 Agent 的“读工具”和“写工具”并写出你需要的安全措施确认、权限、审计。