2026/3/1 4:04:48
网站建设
项目流程
广州建设营销型网站,广州seo网站推广顾问,成都网站设计网站,低价网站设计多少钱在过去一年中#xff0c;构建 AI 智能体通常意味着一个固定模式#xff1a;设置一个循环#xff0c;接收用户指令#xff0c;将其发送给大模型#xff08;LLM#xff09;#xff0c;解析工具调用#xff0c;执行工具#xff0c;然后将结果返回#xff0c;如此往复。这…在过去一年中构建 AI 智能体通常意味着一个固定模式设置一个循环接收用户指令将其发送给大模型LLM解析工具调用执行工具然后将结果返回如此往复。这便是我们所说的“浅层智能体”或“智能体 1.0”。这种架构在处理事务性任务时例如“东京天气如何我该穿什么”表现出色因为它极其简单。然而一旦任务需要几十个步骤并持续数天这些智能体往往会分心、丢失上下文、陷入无限循环甚至出现幻觉。这是因为这类任务所需步骤过多超出了单一上下文窗口的处理能力。目前我们正目睹一场架构上的转变朝着“深度智能体”或“智能体 2.0”迈进。这些系统不再仅仅通过循环进行被动响应而是结合了多种“智能体模式”来规划任务、管理“持久化内存/状态”并将工作委派给专业化的“子智能体”从而解决多步骤、复杂的难题。智能体架构概览智能体 1.0“浅层”循环的局限性为了理解未来的发展方向我们首先需要审视当前的状态。目前大多数智能体都属于“浅层”智能体这意味着它们完全依赖大模型LLM的上下文窗口即对话历史来维持其状态。其工作流程通常如下用户指令“查一下苹果公司的股价并告诉我是否值得买入。”LLM 推理“我需要使用搜索工具。”工具调用search(AAPL stock price)观察结果工具返回数据。LLM 回答根据观察结果生成回复或者调用另一个工具。重复循环执行直到任务完成。这种架构是无状态且短暂的。智能体的整个“大脑”都局限于上下文窗口内。当任务变得复杂时例如“研究 10 家竞争对手分析它们的定价模型制作一份对比电子表格并撰写一份战略总结”它将由于以下原因而失败上下文溢出工具输出HTML、杂乱的数据会迅速填满上下文历史将重要的指令挤出上下文窗口。目标丢失在中间步骤的噪音中智能体会忘记最初的目标。无恢复机制如果它误入歧途很少有预见性来停止、回溯并尝试新的方法。浅层智能体擅长处理 5 到 15 个步骤的任务但对于需要 500 个步骤的任务则束手无策。智能体 2.0深度智能体的架构深度智能体将规划与执行分离并在上下文窗口之外管理内存。其架构由以下四个支柱组成支柱一显式规划浅层智能体通过思维链例如“我应该先做 X然后做 Y”进行隐式规划。而深度智能体则使用工具来创建和维护显式计划这可以是一个 Markdown 文档中的待办事项列表。在每个步骤之间智能体都会审查并更新这个计划将步骤标记为“待处理”、“进行中”或“已完成”或者添加备注。如果某个步骤失败它不会盲目地重试而是更新计划以适应此次失败。这使得智能体能够始终专注于高层次任务。支柱二分层委托子智能体复杂的任务需要专业化分工。浅层智能体试图在一个指令中扮演多面手而深度智能体则采用“协调器 → 子智能体”的模式。协调器将任务委派给一个或多个子智能体每个子智能体都有一个独立的、清晰的上下文。子智能体例如“研究员”、“程序员”、“撰稿人”执行其工具调用循环搜索、处理错误、重试然后汇总最终答案并将仅合成后的答案返回给协调器。支柱三持久化内存为了防止上下文窗口溢出深度智能体利用外部内存源如文件系统或向量数据库作为其事实来源。像 Claude Code 和 Manus 这样的框架允许智能体对这些外部源进行读写访问。智能体可以将中间结果代码、草稿文本、原始数据写入其中。后续的智能体只通过文件路径或查询来检索必要的信息。这将范式从“记住一切”转变为“知道在哪里可以找到信息”。支柱四极致上下文工程更智能的模型并非不需要提示而是需要更好的上下文。你无法通过一句“你是一个乐于助人的 AI”来获得智能体 2.0 的行为。深度智能体依赖于高度详细的指令有时长达数千个令牌。这些指令定义了何时停止并规划而非直接行动。何时生成子智能体以及何时自行完成工作。工具的定义以及何时、如何使用工具的示例。文件命名和目录结构的标准。人机协作的严格格式。深度智能体流程可视化这些支柱是如何协同工作的呢让我们通过一个序列图来了解深度智能体如何处理一个复杂请求“研究量子计算并将总结写入文件。”深度智能体序列图总结从浅层智能体到深度智能体智能体 1.0 到智能体 2.0的转变不仅仅是将大模型连接到更多工具。它代表着从被动循环到主动架构的转变以及对模型进行更精良的工程设计。通过实施显式规划、分层委托通过子智能体和持久化内存我们能够更好地控制上下文。通过控制上下文我们便能驾驭复杂性从而能够解决需要数小时甚至数天才能完成的问题而不仅仅是几秒钟。“深度智能体”一词主要由 LangChain 团队推广用以描述这一架构演进。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】