北京建设质量协会网站公司做网站需要注意什么
2026/1/15 10:26:52 网站建设 项目流程
北京建设质量协会网站,公司做网站需要注意什么,全网营销平台,企业信用信息查询公示系统浙江本文探讨AI Agent从上下文工程向记忆工程的演进#xff0c;指出多数Agent失败源于记忆问题而非推理。解析LLM的三大记忆缺陷#xff0c;提出构建分层记忆系统解决方案#xff0c;并针对多智能体协作#xff0c;阐述记忆工程的五大支柱。记忆工程使Agent获得连续性、学习能力…本文探讨AI Agent从上下文工程向记忆工程的演进指出多数Agent失败源于记忆问题而非推理。解析LLM的三大记忆缺陷提出构建分层记忆系统解决方案并针对多智能体协作阐述记忆工程的五大支柱。记忆工程使Agent获得连续性、学习能力和协作基础是构建可靠、可信、有能力AI系统的关键。开篇在Agent的浪潮中我们经历了一次又一次的认知迭代。最初是提示工程我们学习如何更好地提问随后是上下文工程随着窗口从8k卷到1M我们误以为塞进去就是记住了。但当Manus、Anthropic 等团队开始引入file system和agent skill等概念后上下文工程的边界又变得日益模糊。最近看了AWS re:Invent 2025 中关于memory的一场技术演讲以及MongoDB的一篇技术博客让我对上下文和记忆这两者有了更清晰的认知。“上下文Context不等于记忆Memory。”“大多数 Agent 的失败不是推理的失败而是记忆的失败。”“因为我们正在试图用本质上无状态的大语言模型去解决高度有状态的现实世界问题。”“要构建能够长期运行、处理复杂任务甚至多智能体协作的系统我们必须跨越上下文工程正式迈入记忆工程。”LLM的内生局限与破局在谈论记忆之前我们需要先认清 LLM 的本质。作为一个推理引擎它在记忆层面存在三个结构性缺陷参数记忆的静态性对于模型来说世界在训练截止日那天就停止了。上下文窗口的临时性上下文窗口虽然变大了但它本质上只是工作记忆。一旦会话结束或超出窗口限制信息就会瞬间消失。无状态本质LLM本身没有跨会话的持久状态概念。它不知道你是谁除非你在每一次交互中都重新告诉它。更糟糕的是即便我们强行塞入海量上下文真正被有效利用的部分往往只有20-30%。随着输入长度增加模型的注意力会分散导致Lost in the Middle连简单的指令遵循能力都会退化。那么该如何解决呢我们可以向人类的认知架构取取经。人类大脑是一个极强的CPU但我们的工作记忆RAM非常有限。我们之所以能处理复杂任务是因为我们拥有强大的外置认知层——笔记、书籍、数据库。我们不强求记住所有而是擅长索引和检索。AI Agent 的进化方向正是如此从「全量上下文」转向「外挂记忆库」。这意味着我们不再追求把所有信息一次性塞进prompt而是构建一套持久化的记忆系统。**这套系统的价值在于连续性**它能确保 Agent 在与用户的第 100 次交互时依然能精准调用第 1 次交互时留下的关键线索从而产生真正的默契。走出误区从上下文工程到记忆工程这是最容易混淆的概念。下面明确一下定义上下文Context是指 LLM 在单次交互中能够处理的文本量。它是临时的、易失的本质上是工作记忆。记忆Memory是一种持久化的管理系统它能将无状态的Agent转变为能够学习、适应并保持连续性的实体。如上图所示上下文工程和记忆工程是紧密协作但截然不同的两个领域记忆工程负责构建持久的、智能的存储系统决定「保留什么」和「遗忘什么」。上下文工程则利用这些系统动态地筛选出与当前决策最相关的片段决定「让模型此刻看到什么」。上下文工程的现状与瓶颈目前许多Agent开发仍停留在上下文工程阶段。我们通过RAG、prompt优化等手段试图在有限的窗口内塞入更多信息。但上下文工程面临着垃圾场效应。如图所示随着对话进行上下文窗口会迅速变成一个充满了提示词、工具调用结果、错误尝试和无关元数据的垃圾场。这不仅极其昂贵Token 成本爆炸还会引入噪音导致模型幻觉。要解决这个问题仅仅优化怎么塞是不够的我们需要优化存什么——这就引出了记忆工程。记忆的进阶从私人助理到智能团队既然无限堆叠上下文行不通那么就可以针对不同的Agent形态设计差异化的记忆架构。根据MongoDB演讲者的定义AI Agent主要有三种应用模式它们对记忆的要求层层递进1、助手模式解决连贯性场景客服、私人助理。核心需求会话连贯性。需要记住用户的偏好、历史对话保持“人设”一致。记忆痛点一旦切断会话用户就像面对一个新客服一样需要重述问题。2、工作流模式解决鲁棒性场景自动化流程如 Dify、数据处理管道。核心需求逐步执行过程的记忆。需要记录检查点、中间状态和工具输出。记忆痛点如果任务中断Agent 能否从第 8 步继续而不是从第 1 步重头再来3、多智能体Deep Research模式解决一致性这里是记忆工程真正的挑战从构建单一助手转向多智能体系统时对记忆的需求发生了质的飞跃。研究显示多智能体系统的失败率高达 40%-80%其中大量的失败源于智能体间的不对齐。具体的失败模式包括工作重复Agent A 搜索了资料Agent B 不知道又去搜了一遍。状态不一致Agent A 认为任务已完成Agent B 认为还在进行中。通信爆炸为了同步信息Agent 之间疯狂对话消耗了海量 Token 却只为了解释背景。级联故障一个 Agent 的幻觉污染的上下文传播给了所有其他 Agent导致整个系统崩溃。解决这些问题的唯一途径就是构建一个结构化的、共享的记忆工程体系。记忆类型解剖分层管理我们不能把所有数据一股脑丢进数据库要像人类的大脑一样对记忆进行精密的分层管理。如上图可以清晰地看到一个成熟的记忆系统由三大板块构成短期记忆 (STM)、长期记忆 (LTM)以及连接两者的协调机制。1、短期记忆 (STM)系统的草稿纸这是Agent的前台接待处负责处理高频、瞬时的信息流。工作记忆即当前的上下文窗口。它负责当下的推理任务就像人脑的RAM容量有限随用随清。语义缓存这是降低成本的神器。如果用户曾问过“如何重置密码”系统直接从缓存层返回答案而无需再次调用昂贵的 LLM。 响应时间从 2秒 - 50毫秒Token成本降为0。2、长期记忆 (LTM)系统的硬盘这是 Agent 产生智能积累的核心区域。随着时间推移Agent会越来越聪明全靠这一层程序性记忆记录「怎么做」存储工作流状态、工具使用方法以及成功的任务路径SOP。这让 Agent 像老员工一样越干越熟练。情景记忆记录「发生了什么」存储历史对话日志和摘要。它提供了连续性的体验让Agent记得你们上周聊过的开心事。语义记忆记录「什么是真实的」存储事实知识库、实体信息如用户的职位、名字以及 Agent 自身的角色设定。3、架构升级从个人笔记到团队白板当场景升级到多智能体协作时仅仅只有个体的STM和LTM是不够的。我们需要引入第三层维度。Mikiko Bazeley提出的多智能体记忆架构如下图所示清晰地展示了如何通过引入外部共享记忆解决团队协作难题。在多Agent环境下记忆工程面临三个全新的挑战一致性、隔离性与并发性。1共享一致性引入白板机制 这是团队的实时会议室。定义一个实时的、共享的短期外部记忆区。作用所有的 Agent 都在这里交换情报、同步状态。它是动态的随任务结束而清空。场景当 Agent A 完成了步骤1它不需要给所有 Agent 汇报只需更新白板。Agent B 看一眼白板就知道自己该接手步骤2了。2跨Agent协调确立共识机制 这是团队的公司法和SOP。定义存储经过验证的团队规程的长期记忆区。作用当 Agent 之间产生分歧例如 A 说向左B 说向右时共识记忆是唯一的真理来源。人设记忆同时这里还存储了团队组织架构图定义了每个 Agent 的权限边界防止“财务 Agent”去修改“代码库”确保专业分工互不干扰。3隔离与隐私独立的上下文窗口 虽然有共享但每个Agent依然保留独立的短期内部记忆。财务Agent的草稿纸上不应该出现营销 Agent的头脑风暴记录。保持上下文的纯净和隔离是防止逻辑干扰和幻觉的关键。记忆工程的核心从生命周期到五大支柱明白了记忆的分类存什么接下来的核心问题是怎么存和怎么管记忆工程绝不仅仅是把数据丢进数据库。它是一门复杂的系统设计学科让Agent像生物一样建立起从原始数据到智慧经验的完整转换管道。1、数据炼金记忆的生命周期一个成熟的记忆系统数据不再是静态的记录而是一条流动的数据流。如下图所示原始数据需要经历一个完整的转换管道才能成为可用的记忆。在这个管道中每一个环节都至关重要聚合与过滤去噪不要把“你好”、“在吗”这种废话存入长期记忆。提炼利用 LLM 从嘈杂的交互中提取高价值信号例如“用户意图是重置密码”而非原始对话流。编码将信息转化为向量用于模糊语义搜索和结构化数据JSON/图数据库用于精确属性查询。存储元数据丰富化存入数据库时必须打上时间戳、来源、置信度等标签为后续的检索提供上下文。检索与组织动态索引根据时间顺序或主题相关性建立索引确保在正确的时间提取正确的信息。遗忘至关重要的一环遗忘不是系统的Bug而是Feature。系统需要智能地降低过时信息如去年的天气的权重。没有遗忘记忆就会变成垃圾场。这是不是和rag的流程很像呢老师经常强调学好rag是学习agent的基础2、工程落地指南记忆系统的五大支柱知道了原理如何构建这样一套复杂的系统呢MongoDB的技术团队为我们总结了工程落地的五大支柱。这五个维度构成了记忆工程的基石。1持久化写入上下文 多智能体系统必须超越上下文窗口拥有独立的持久化层。共享Todo列表这不仅仅是一个文本文件而是一个动态的状态机。所有Agent都能看到当前的目标进度确保劲往一处使。程序性记忆演进优秀的系统不仅记录发生了什么情景记忆还记录怎么做程序性记忆。随着项目进行系统应能自动更新工作流将成功的协作模式固化下来。2检索选择上下文 在多智能体环境中检索不再是简单的向量相似度匹配。基于 Agent 角色的查询当财务Agent查询“Q3数据”时它应该得到详细的报表而文案Agent查询同一关键词可能只需要一个总结数字。记忆系统必须理解谁在提问。时序协调紧急的信息如“数据库已锁死”必须拥有高优先级能够打断Agent的当前任务并注入其上下文而普通信息则应被缓存等待Agent空闲时获取。3优化压缩上下文 为了防止token成本指数级增长优化至关重要。分层摘要Agent A 和 Agent B 之间可能交互了 50 轮但对于 Agent C 来说它只需要知道“他们决定采用 Python 编写后端”。系统需要自动生成不同颗粒度的摘要。智能遗忘这是一种高级的生命周期管理。我们不直接删除数据而是降低其记忆强度。随着时间推移不再被激活的记忆会逐渐淡出检索范围就像人类的遗忘曲线一样。4分离隔离上下文 多智能体协作最怕大杂烩。领域隔离确保 Agent 专注于其专业领域的记忆。营销 Agent 不需要加载全量的技术架构文档这不仅节省 Token还能防止非专业领域的知识干扰决策减少幻觉。协调边界在系统层面需要有专门的记忆管理Agent来负责跨团队的记忆搬运而不是让每个工作Agent自己去翻阅所有档案。5整合同步上下文 这是多智能体系统最棘手的部分并发与一致性。原子操作当多个Agent试图同时更新共享记忆例如修改同一个PRD时系统必须支持原子操作要么全部更新成功要么全部失败回滚绝不能出现「写了一半」的脏数据。冲突解决机制当 Agent A 说“用户是男性”Agent B 说“用户是女性”时系统需要基于置信度、数据新鲜度或角色权威性来自动仲裁。记忆系统的评估回顾一下为什么要有记忆工程呢因为会有以下几种情况出现记忆失败遗忘、编造虚假记忆或存储过多噪音导致上下文退化和中毒。检索失败提取无关、过时或处于上下文中间的信息。工作流失败丢失状态、中断多步骤任务、循环或传播错误。协调失败代理冲突、重复工作或覆盖共享内存。那么有了记忆系统之后该如何判断是否成功呢MongoDB的技术团队提到一个优秀的记忆系统应该符合RBC 框架Reliable (可靠)不丢失任务状态推理可复现。Believable (可信)保持角色一致性建立用户信任。Capable (有能力)随着时间推移能扩展技能从经验中学习。或者也可以通过以下四个失败信号来判断此外也可以根据上面的五个支柱维度结合具体业务构建数据集进行评估。最后Mikiko Bazeley在演讲结尾留了三个建议首先你需要区分可见性与持久性。其次记忆必须通过模式来设计流程和评估循环。再者只有当记忆系统可靠且有用时智能体本身才能变得可靠且有用。AI 的未来不仅仅在于更强的模型更在于更强的记忆。它让Agent拥有了时间感拥有了经验更拥有了与小伙伴们并肩作战的信任基础。随着大模型的持续火爆各行各业纷纷开始探索和搭建属于自己的私有化大模型这无疑将催生大量对大模型人才的需求也带来了前所未有的就业机遇。**正如雷军所说“站在风口猪都能飞起来。”**如今大模型正成为科技领域的核心风口是一个极具潜力的发展机会。能否抓住这个风口将决定你是否能在未来竞争中占据先机。那么我们该如何学习AI大模型呢得益于新岗位相较于被取代岗位更高的生产效率全社会的整体生产效率实际上是不断提升的。然而对每个个体而言更准确的说法是“率先掌握AI技术的人将比后来者更具竞争优势”。这个道理在计算机、互联网乃至移动互联网兴起的每一个时代初期都同样适用。作为一名在互联网一线企业拥有十多年工作经验的老兵我指导过许多同行和后辈也帮助了不少人实现能力提升和职业成长。在这个过程中我积累了许多值得分享的经验和知识也希望能用自己的专业能力为正在学习人工智能的你答疑解惑。尽管日常工作已经非常繁忙我仍然坚持整理和输出这些内容。但由于信息传播渠道有限许多互联网人难以获取系统、可靠的学习资料来实现自我提升。因此我决定免费分享一批重要的AI大模型资料包括AI大模型入门学习思维导图、精选学习书籍与手册、配套视频教程以及部分实战学习录播视频。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】为什么大家都在学大模型最近科技巨头英特尔宣布裁员2万人传统岗位不断缩减但AI相关技术岗疯狂扩招有3-5年经验大厂薪资就能给到50K*20薪不出1年“有AI项目经验”将成为投递简历的门槛。风口之下与其像“温水煮青蛙”一样坐等被行业淘汰不如先人一步掌握AI大模型原理应用技术项目实操经验“顺风”翻盘大模型入门到实战全套学习大礼包01大模型系统化学习路线作为学习AI大模型技术的新手方向至关重要。 正确的学习路线可以为你节省时间少走弯路方向不对努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划带你从零基础入门到精通02大模型学习书籍文档学习AI大模型离不开书籍文档我精选了一系列大模型技术的书籍和学习文档电子版它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。03AI大模型最新行业报告2025最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。04大模型项目实战配套源码学以致用在项目实战中检验和巩固你所学到的知识同时为你找工作就业和职业发展打下坚实的基础。05大模型大厂面试真题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我精心整理了一份大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。06全套AI大模型应用开发视频教程包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点一、初阶应用建立AI基础认知在第一阶段10天重点是对大模型 AI 的基本概念和功能进行深入了解。这将帮助您在相关讨论中发表高级、独特的见解而不仅仅是跟随他人。您将学习如何调教 AI以及如何将大模型与业务相结合。主要学习内容大模型AI的功能与应用场景探索AI在各个领域的实际应用AI智能的起源与进化深入了解AI如何获得并提升其智能水平AI的核心原理与心法掌握AI技术的核心概念和关键原理大模型应用的业务与技术架构学习如何将大模型AI应用于业务场景和技术架构中代码实践向GPT-3.5注入新知识的示例代码提示工程的重要性与核心思想理解提示工程在AI应用中的关键作用Prompt的构建与指令调优方法学习如何构建有效的Prompt和进行指令调优思维链与思维树的应用掌握思维链和思维树在AI推理和决策中的作用Prompt攻击与防范策略了解Prompt攻击的类型和如何进行有效的防范、、、二、中阶应用深入AI实战开发在第二阶段30天您将进入大模型 AI 的进阶实战学习。这将帮助您构建私有知识库扩展 AI 的能力并快速开发基于 agent 的对话机器人。适合 Python 和 JavaScript 程序员。主要学习内容RAG的重要性理解RAG在AI应用中的关键作用构建基础ChatPDF动手搭建一个简单的ChatPDF应用检索基础掌握信息检索的基本概念和原理理解向量表示深入探讨Embeddings的原理和应用向量数据库与检索技术学习如何使用向量数据库进行高效检索基于 vector 的 RAG 实现掌握基于向量的RAG构建方法RAG系统的高级扩展探索RAG系统的进阶知识和技巧混合检索与RAG-Fusion了解混合检索和RAG-Fusion的概念和应用向量模型的本地部署策略学习如何在本地环境中部署向量模型三、高阶应用模型训练在这个阶段你将掌握模型训练的核心技术能够独立训练和优化大模型AI。你将了解模型训练的基本概念、技术和方法并能够进行实际操作。模型训练的意义理解为什么需要进行模型训练。模型训练的基本概念学习模型训练的基本术语和概念。求解器与损失函数了解求解器和损失函数在模型训练中的作用。神经网络训练实践通过实验学习如何手写一个简单的神经网络并进行训练。训练与微调掌握训练、预训练、微调和轻量化微调的概念和应用。Transformer结构了解Transformer的结构和原理。轻量化微调学习如何进行轻量化微调以优化模型性能。实验数据集构建掌握如何构建和准备实验数据集。四、专家应用AI商业应用与创业在这个阶段你将了解全球大模型的性能、吞吐量和成本等方面的知识能够在云端和本地等多种环境下部署大模型。你将找到适合自己的项目或创业方向成为一名被AI武装的产品经理。硬件选型学习如何选择合适的硬件来部署和运行大模型AI。全球大模型概览了解全球大模型的发展趋势和主要玩家。国产大模型服务探索国产大模型服务的优势和特点。OpenAI代理搭建学习如何搭建OpenAI代理以扩展AI的功能和应用范围。热身练习在阿里云 PAI 上部署 Stable Diffusion本地化部署在个人计算机上运行大型模型私有化部署策略大型模型的内部部署方法利用 vLLM 进行模型部署高效部署大型模型的技术案例分析如何在阿里云上优雅地私有部署开源大型模型开源 LLM 项目的全面部署从零开始部署开源大型语言模型内容安全与合规确保AI应用的内容安全和合规性算法备案流程互联网信息服务算法的备案指南通过这些学习内容您不仅能够掌握大模型 AI 的基本技能还能够深入理解其高级应用从而在市场竞争中占据优势。天道酬勤你越努力就会成为越优秀的自己。如果你能在15天内完成所有的任务那你无疑是AI领域的佼佼者。然而即使你只能完成60-70%的内容你也已经展现出了成为一名大模型AI大师的潜力。最后本文提供的完整版大模型 AI 学习资料已上传至 CSDN您可以通过微信扫描下方的 CSDN 官方认证二维码免费领取【保证100%免费】。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询