2026/4/1 4:58:06
网站建设
项目流程
太原网站开发工程师,黄冈公司网站推广软件首选,网站点击量统计,医院网站模板下载最近看了一些关于RAG的论文以及一篇博客《关于从RAG到Agentic RAG再到Agent Memory的演进历程》。
博客地址#xff1a;https://www.leoniemonigatti.com/blog/from-rag-to-agent-memory.html#agent-memory-read-write-via-tool-calls
一直都有听说RAG已死#xff0c;于是有了…最近看了一些关于RAG的论文以及一篇博客《关于从RAG到Agentic RAG再到Agent Memory的演进历程》。博客地址https://www.leoniemonigatti.com/blog/from-rag-to-agent-memory.html#agent-memory-read-write-via-tool-calls一直都有听说RAG已死于是有了Agentic RAG。刚搞明白Agentic RAG又出现了Agent Memory。“RAG是不是已经过时了是不是已死”“Agentic RAG和Agent Memory到底有什么区别”“Agent Memory究竟是啥它和RAG是替代关系吗”这篇文章就是我在解决以上疑惑过程中所整理出来的会分为以下四个部分希望能够给你们带来新的思考☺️RAG-Agentic RAG-Agent Memory以智能客服为例这三者的关系Agent Memory没那么简单RAG-Agentic RAG-Agent Memory1、RAG 1.0Naïve RAG首先RAG并没有死**它是这一切的基石。**我们先回忆一下朴素RAGNaïve RAG是LLM已有知识是旧的训练完就定了而且它不知道具体某公司的内部文档。RAG就是相当于给它一本参考书比如公司的知识库通过检索外部知识来增强LLM的回答。 工作流如下线下先把你的文档资料“存入”知识库比如向量数据库。 线上用户提问 - 系统必须先去知识库里搜相关资料单步检索- 把“搜到的资料 用户问题”一起扔给 LLM - LLM 参考着回答。这就好比开卷考试LLM每回答一个问题就必须翻一次书。 局限性这种 RAG 是静态单步的。它有些傻不管问题复不复杂都只会翻一次书而且是只读的。它无法在对话中学习新东西。2、RAG 2.0Agentic RAGAgentic RAG是RAG的第一次重大升级核心是引入了自治智能体。LLM不再是被动的它变成了一个会主动思考、会规划、会用工具的研究助理。 工作流如下1.用户提问比如“帮我查查苹果公司最近的财报并总结下市场反应。” 2.AgentLLM开始思考和规划“OK这个任务得分两步1搜财报2搜市场反应。” 3.Agent调用工具比如搜索执行“搜索苹果财报”。 4.Agent反思“嗯财报拿到了。现在我需要执行第二步。” 5.Agent再次调用工具执行“搜索市场对苹果财报的反应”。 6.最后Agent 汇总所有多轮检索到的信息生成最终答案。和 RAG 1.0 的核心区别RAG 1.0 是「必须搜搜一次」。Agentic RAG是「**Agent 自己决定搜不搜、搜几次、用什么工具搜」。**这种检索是动态的、多步的。 但是请注意Agentic RAG核心解决的是读的问题。它让读变得更智能、更动态了。可它本质上还是只读的知识库仍然是离线预加载的。它在对话中了解到的新信息比如你的偏好对话结束了就忘了。3、RAG 3.0?Agent Memory这时就需要Agent Memory登场了。如果说Agentic RAG是一个出色的研究助理会查资料那么Agent Memory就是一个能记住你、持续学习的私人管家。那么Agent Memory到底是什么呢核心定义Agent Memory智能体记忆是指智能体具备调用工具读写外部知识库的能力让模型能在对话中记住新的信息。 和 Agentic RAG 最大的区别就一个字写。Agent Memory不仅有搜索工具读它还有了存储/写入/更新工具。 工作流如下用户“我下周要去上海出差帮我规划下。” Agent带记忆 调用工具规划...“好的已规划。顺便问下你有什么饮食偏好吗” 用户“哦对了我海鲜过敏千万别安排海鲜。” Agent调用写工具 思考“这是个重要信息”- 调用WriteTool.store(用户偏好海鲜过敏) - 将这条信息存入外部记忆库。 下次对话时 用户 “帮我推荐几个北京的餐厅。” Agent调用“读”工具 思考“我需要推荐餐厅先查查用户有啥偏好”- 调用SearchTool.search(用户偏好) - 检索到“用户偏好海鲜过敏”。 Agent生成 “好的已为您筛选了北京的几家餐厅并自动排除了所有海鲜餐厅。”通过动态的「读写」外部记忆实现持续学习和个性化。它使LLM成为有长期记忆的智能体能跨会话累积经验。举例一个智能客服的进化史阶段一Naïve RAG基础问答机器人在这个阶段客服机器人就像一个只会照着说明书念的员工。它的知识库是静态的比如产品手册、退货政策并且它总是先查资料再回答。知识库离线准备文档 A退货政策文档 B产品说明书型号 X、Y、Z文档 C发货时间表用户提问“你好我想退货。” Naïve RAG的工作流 1.强制检索系统自动将“我想退货”作为关键词去知识库里搜索。 2.找到内容命中了“文档 A退货政策”检索到相关片段“...如需退货请在订单页面点击‘申请售后’并在7天内寄回...” 3.生成答案LLM将“检索到的内容”和“用户问题”结合起来。 4.客服回复“您好根据我们的政策如需退货请在订单页面点击‘申请售后’并在7天内寄回...” 局限性**答非所问**如果用户问“我的订单到哪了” LLM去静态知识库里检索找不到实时物流信息它可能会回复一个关于标准发货时间的通用答案比如“我们通常在48小时内发货”而不是用户想要的实时状态。无法处理多任务用户问“我的A订单什么状态顺便帮我看看B产品有没有货” 它会很困惑可能只能回答第一个问题或者两个都答不好。阶段二Agentic RAG多功能工具助理在这个阶段客服机器人升级成了一个聪明的助理。它拥有多种工具并且会思考该用哪个工具、甚至是否需要用工具。但它的知识库本身仍然是只读的。可用的工具KnowledgeBaseSearch搜索静态的退货政策、产品说明书。OrderTrackingAPI实时查询订单物流状态。InventoryCheckAPI实时查询商品库存。用户提问“我的 A 订单到哪了顺便帮我看看 B 产品有没有货” Agentic RAG 的工作流 思考LLM as Agent“用户有两个问题。第一个是关于订单状态我需要用OrderTrackingAPI。第二个是关于库存我需要用 InventoryCheckAPI。” 动态调用工具 1 Call: OrderTrackingAPI(order_idA) Return: {status: 已签收, time: 2025-11-10 09:30} 动态调用工具 2 Call: InventoryCheckAPI(product_idB) Return: {stock: 120, status: 有货} 整合答案LLM拿到了两份工具返回的实时数据。 客服回复“您好我帮您查到1. 您的订单 A 已于今天上午 9:30 签收。2. 您查询的产品 B 目前有 120 件库存可以下单。” 局限性没有记忆如果用户接着说“太好了。以后请叫我‘晨光’并且我只在工作日收货。”这个Agentic RAG客服会说“好的。” 但下次对话时它会忘得一干二净因为它没有写入新信息的能力。它只是一个出色的信息查询员。阶段三Agent Memory专属私人管家这是目前最先进的阶段。客服机器人不仅拥有Agentic RAG的所有能力会用工具还额外获得了写入工具。它开始学习和记忆用户的偏好和历史。可用的工具读KnowledgeBaseSearch读OrderTrackingAPI读InventoryCheckAPI读/写MemoryTools.Search(user_id)读/写MemoryTools.Write(user_id, info)【场景A】用户提出偏好 用户提问“以后请叫我‘晨光’并且我只在工作日收货。” Agent Memory的工作流 思考LLM as Agent“用户提出了两个关键偏好。我需要把它们‘记下来’。” 动态调用工具写入记忆 Call: MemoryTools.Write(user_id123, infoNickname: 晨光) Call: MemoryTools.Write(user_id123, infoDeliveryPreference: workdays_only) 客服回复“好的晨光。我记住了以后会尽量安排在工作日为您配送。” 【场景B】几天后的下一次对话 用户提问“你好帮我查下我上次买的那个耳机型号。” Agent Memory的工作流 思考LLM as Agent“用户开始了新对话。我应该先‘回忆’一下关于她的信息。” 动态调用工具读取记忆 Call: MemoryTools.Search(user_id123) Return: [Nickname: 晨光, DeliveryPreference: workdays_only] 动态调用工具读取订单历史 Call: OrderTrackingAPI(user_id123, history_limit1, typeheadphones) 整合答案LLM拿到了“记忆”和“订单数据”。 客服回复“您好晨光我查到您上次购买的耳机型号是M-Tech降噪耳机Pro。需要我为您做些什么吗”灵魂拷问三者到底什么关系终于可以回答开头的问题了。1、RAG 死了吗没有。RAG 是地基。Agentic RAG把RAG变成了它工具箱里一个更智能的工具Agent Memory则在Agentic RAG的基础上又增加了一个写入工具。2、Agentic RAG vs Agent MemoryAgentic RAG 动态只读。重点在Agent如何更聪明地检索信息。Agent Memory 动态读动态写。重点在Agent如何管理信息。 结论Agent Memory吸收RAG能力把它当作记忆读写的一部分工具来用但不会废弃RAG尤其在涉及“海量文档检索”或“信息密度很高”的企业场景下RAG的向量检索仍然是不可替代的底层能力。Agent Memory没那么简单那Agent Memory不就是加个写入吗其实真正的挑战不在于写入这个动作本身而在于写入之后带来的一整套复杂的记忆管理难题。1、决定记什么——写入策略难题“你好”、“哈哈”、“嗯”这种无关紧要的词语不能全记下来如果无序地记录一切会导致记忆冗余和上下文污染。 必须有智能的触发式写入比如Agent必须学会判断什么是重要事实如“海鲜过敏”、“称呼晨光”或者采用摘要写入机制只存储对话摘要而非全部记录。2、决定怎么读——读取策略**难题**用户的记忆库越来越大当用户问“老样子”时Agent如何在成千上万条记忆中精准找出“老样子”指的是“拿铁少冰”还是“周五下午开会” 这需要高效的检索比如结合向量语义检索、重要性评分、新近度评分等。斯坦福的Generative Agents研究提出了「新近度重要性相关性」的三重检索评分机制。3、决定何时忘——遗忘策略难题一个只记不忘的Agent是灾难性的。如果用户搬家了Agent却还记着旧地址怎么办如果信息冲突了怎么办 必须有适当的遗忘。常见的机制包括时间衰减临时信息如验证码到期自动删除。使用频率长期不用的记忆被淘汰类似 LRU 策略。重要度模型评估为不重要的信息被丢弃。人工干预允许用户“一键忘记”满足 GDPR 等隐私法规。…4、隐私与安全——记忆的保险箱**难题**记住“晨光”是小事如果Agent记住了用户的身份证号、银行卡、家庭住址呢这带来了巨大的隐私合规风险和记忆错乱的可能。 这需要严格的权限控制、数据加密以及用户授权机制。 总结一下从Agentic RAG到Agent Memory最大的挑战是从一个无状态的查询工具进化为一个有状态的持久化系统。这个系统必须具备一套完整的写-读-忘循环策略以确保记忆是高效、准确、安全且有用的。总结RAG在进化而非死亡现在我们可以清晰地看到这条路线RAG 1.0 (Naïve RAG):静态的开卷考试。解决了LLM的知识局限性只读。RAG 2.0 (Agentic RAG):聪明的研究助理。解决了RAG 1.0检索过程太死板的问题智能读。RAG 3.0 (Agent Memory):会学习的私人管家。解决了Agent无法记住新信息、无法实现个性化的问题智能读 智能写。所以RAG远没有“已死”它们三者将共同存在构成更强大的「知识记忆推理」的一体化代理支撑着Agent走得更远。想入门 AI 大模型却找不到清晰方向备考大厂 AI 岗还在四处搜集零散资料别再浪费时间啦2025 年AI 大模型全套学习资料已整理完毕从学习路线到面试真题从工具教程到行业报告一站式覆盖你的所有需求现在全部免费分享扫码免费领取全部内容一、学习必备100本大模型电子书26 份行业报告 600 套技术PPT帮你看透 AI 趋势想了解大模型的行业动态、商业落地案例大模型电子书这份资料帮你站在 “行业高度” 学 AI1. 100本大模型方向电子书2. 26 份行业研究报告覆盖多领域实践与趋势报告包含阿里、DeepSeek 等权威机构发布的核心内容涵盖职业趋势《AI 职业趋势报告》《中国 AI 人才粮仓模型解析》商业落地《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》领域细分《AGI 在金融领域的应用报告》《AI GC 实践案例集》行业监测《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。3. 600套技术大会 PPT听行业大咖讲实战PPT 整理自 2024-2025 年热门技术大会包含百度、腾讯、字节等企业的一线实践安全方向《端侧大模型的安全建设》《大模型驱动安全升级腾讯代码安全实践》产品与创新《大模型产品如何创新与创收》《AI 时代的新范式构建 AI 产品》多模态与 Agent《Step-Video 开源模型视频生成进展》《Agentic RAG 的现在与未来》工程落地《从原型到生产AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。二、求职必看大厂 AI 岗面试 “弹药库”300 真题 107 道面经直接抱走想冲字节、腾讯、阿里、蔚来等大厂 AI 岗这份面试资料帮你提前 “押题”拒绝临场慌1. 107 道大厂面经覆盖 Prompt、RAG、大模型应用工程师等热门岗位面经整理自 2021-2025 年真实面试场景包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题每道题都附带思路解析2. 102 道 AI 大模型真题直击大模型核心考点针对大模型专属考题从概念到实践全面覆盖帮你理清底层逻辑3. 97 道 LLMs 真题聚焦大型语言模型高频问题专门拆解 LLMs 的核心痛点与解决方案比如让很多人头疼的 “复读机问题”三、路线必明 AI 大模型学习路线图1 张图理清核心内容刚接触 AI 大模型不知道该从哪学起这份「AI大模型 学习路线图」直接帮你划重点不用再盲目摸索路线图涵盖 5 大核心板块从基础到进阶层层递进一步步带你从入门到进阶从理论到实战。L1阶段:启航篇丨极速破界AI新时代L1阶段了解大模型的基础知识以及大模型在各个行业的应用和分析学习理解大模型的核心原理、关键技术以及大模型应用场景。L2阶段攻坚篇丨RAG开发实战工坊L2阶段AI大模型RAG应用开发工程主要学习RAG检索增强生成包括Naive RAG、Advanced-RAG以及RAG性能评估还有GraphRAG在内的多个RAG热门项目的分析。L3阶段跃迁篇丨Agent智能体架构设计L3阶段大模型Agent应用架构进阶实现主要学习LangChain、 LIamaIndex框架也会学习到AutoGPT、 MetaGPT等多Agent系统打造Agent智能体。L4阶段精进篇丨模型微调与私有化部署L4阶段大模型的微调和私有化部署更加深入的探讨Transformer架构学习大模型的微调技术利用DeepSpeed、Lamam Factory等工具快速进行模型微调并通过Ollama、vLLM等推理部署框架实现模型的快速部署。L5阶段专题集丨特训篇 【录播课】四、资料领取全套内容免费抱走学 AI 不用再找第二份不管你是 0 基础想入门 AI 大模型还是有基础想冲刺大厂、了解行业趋势这份资料都能满足你现在只需按照提示操作就能免费领取扫码免费领取全部内容2025 年想抓住 AI 大模型的风口别犹豫这份免费资料就是你的 “起跑线”