淘宝客建设网站首页天津seo外包平台
2026/1/16 20:42:45 网站建设 项目流程
淘宝客建设网站首页,天津seo外包平台,php笑话网站源码,宽屏网站和普通网站AI之Course之Context Engineering#xff1a;会话与记忆 —— 学习构建能记住历史交互、保持上下文的AI智能体。掌握短期与长期记忆的实现方式#xff0c;以创建能够处理复杂多轮任务的鲁棒智能体—构建有状态 LLM Agent 的会话#xff08;Sessions#xff09;与记忆#…AI之Course之Context Engineering会话与记忆 —— 学习构建能记住历史交互、保持上下文的AI智能体。掌握短期与长期记忆的实现方式以创建能够处理复杂多轮任务的鲁棒智能体—构建有状态 LLM Agent 的会话Sessions与记忆Memory全栈指南导读本文章聚焦如何把无状态的大语言模型LLM构造成“有状态、可记忆、可协作”的智能体Agent。核心命题是仅靠单次 prompt 已无法支撑长期化、个性化与跨任务的智能行为必须把“上下文工程Context Engineering”作为系统化工程——在每次调用前动态构造上下文system 指令、会话历史、工具定义、外部事实与记忆片段并在调用后把有价值信息提炼回写为长期记忆用以支撑未来决策与个性化体验。 技术要点与工程实践亮点—白皮书在工程层面给出了一整套可落地方法把上下文处理拆成 Fetch → Prepare → Invoke → Upload 的热/冷路径流水线把会话Sessions视为包含事件流与短期 state 的工作台强调会话持久化、PII redact、顺序一致性与 compaction滑动窗口、token 截断、recursive summarization策略把记忆Memory视为可检索的语义单元细分声明性/程序性/多模态类型提出用 schema/few-shot 指导抽取、用合并策略解决冲突、用多维排序semantic recency importance provenance优化检索并强调生产化要点异步生成、溯源、置信度、隐私/删除策略及性能/成本权衡。此外针对多 agent 与跨框架场景白皮书建议以 framework-agnostic 的 Memory 层作为语义中介避免直接共享框架特有的事件 blob从而实现互操作与治理。 受众与落地建议—本白皮书既适合技术决策者与平台工程团队构建 Agent 平台、Session/Memory 服务与 Control Plane也对产品经理、数据科学家与安全/合规人员有直接参考价值。落地上建议先做小规模试点内部 Registry 若干被封装的工具/能力在 MCP/工具/记忆功能之上引入 Gateway/审计/权限策略并把“上下文规范Context Spec”、“记忆抽取 schema”与“compaction 策略”作为项目启动必交件以便在扩展时保持可观测性、可审计性和成本可控。目录Context Engineering会话与记忆 —— 学习构建能记住历史交互、保持上下文的AI智能体。掌握短期与长期记忆的实现方式以创建能够处理复杂多轮任务的鲁棒智能体—构建有状态 LLM Agent 的会话Sessions与记忆Memory全栈指南1、Introduction核心要点经验 / 实战技巧2、Context Engineering核心要点经验 / 实战技巧3、Sessions核心要点总体经验 / 实战技巧总体3.1 Variance across frameworks and models核心要点经验 / 实战技巧3.2 Sessions for multi-agent systems核心要点经验 / 实战技巧3.2.1 Interoperability across multiple agent frameworks核心要点经验 / 实战技巧3.3 Production Considerations for Sessions核心要点经验 / 实战技巧3.4 Managing long context conversation: tradeoffs and optimizations核心要点经验 / 实战技巧4、Memory核心要点总体经验 / 实战技巧总体4.1 Types of memory核心要点经验 / 实战技巧4.1.1 Types of information4.1.2 Organization patterns4.1.3 Storage architectures4.1.4 Creation mechanisms4.1.5 Memory scope4.1.6 Multimodal memory4.2 Memory Generation: Extraction and Consolidation核心要点经验 / 实战技巧4.2.1 Deep-dive: Memory Extraction4.2.2 Deep-dive: Memory Consolidation4.2.3 Memory Provenance4.2.4 Triggering memory generation4.3 Memory Retrieval核心要点经验 / 实战技巧4.3.1 Timing for retrieval4.4 Inference with Memories核心要点经验 / 实战技巧4.4.1 Memories in the System Instructions4.4.2 Memories in the Conversation History4.5 Procedural memories核心要点经验 / 实战技巧4.6 Testing and Evaluation核心要点经验 / 实战技巧4.7 Production considerations for Memory核心要点经验 / 实战技巧4.7.1 Privacy and security risks5、ConclusionContext Engineering会话与记忆 —— 学习构建能记住历史交互、保持上下文的AI智能体。掌握短期与长期记忆的实现方式以创建能够处理复杂多轮任务的鲁棒智能体—构建有状态 LLM Agent 的会话Sessions与记忆Memory全栈指南1、Introduction问题背景LLM 本质上是无状态的“模式预测器”要实现有“记忆”、可个性化的 agent必须在每次调用前动态构造上下文——即Context Engineering。白皮书把 Sessions单次交互工作台与 Memory跨会话长时记忆作为两大核心构件。核心要点 LLM 的运行只依赖单次调用的 context window外部持久化与检索是实现长期状态的必要条件。 Context Engineering扩展了传统 prompt engineering变为“动态组装整个 payload”包含 system instructions、few-shot、外部知识、会话历史、工具定义与 memory 等。 会话Session和记忆Memory互补Session 管理即时对话与临时 stateMemory 负责提炼并在未来注入长期上下文。经验 / 实战技巧 在项目启动阶段先定义“Context 样板”哪些元素必须注入system prompt、最近 N-turn、必要 memory、必用工具把 Context 构造列为热路径。 把“上下文准备 → LLM 调用 → 后台上传/合成”视为循环流水线尽量把耗时的 compaction/生成工作异步化。2、Context Engineering提出 Context Engineering 的概念、目标与操作流程Fetch → Prepare → Invoke → Upload以及构成上下文的具体要素与取舍原则相关性优先、最少必要信息原则。核心要点构成要素system instructions、tool definitions、few-shot 示例、evidential/factual dataRAG、session history、state/scratchpad、memory、artifacts非文本数据。热路径/冷路径划分构造上下文Prepare Context通常是请求的热路径必须低延迟memory consolidation 等可后台异步执行Upload Context。动静分离为避免 context bloat优先检索与选择最相关片段并对历史进行压缩/摘要。经验 / 实战技巧先做“Context Spec”规范列出所有可能注入的上下文类型、优先级与最大 token 配额便于 runtime 策略决策。把外部数据RAG与 user-specific memory 做清晰分层RAG 用于事实性查询Memory 用于用户个性化信息检索策略对两者分别优化。Figure 1. Flow of context management for agents3、SessionsSession 是单次连续对话的容器包含事件events用户消息、模型回复、tool calls、tool outputs 等与stateworking memory / scratchpad。生产系统要将会话持久化并考虑安全、数据完整性与性能。核心要点总体 Session 既是即时工作台短期 context也是生成 memory 的主要数据源生产环境应使用持久化存储数据库/managed session store不能仅靠内存。 事件是 append-only 日志的基本单元state 用于短期、可变的数据例如购物车。经验 / 实战技巧总体 生产环境使用可靠的 session 存储保证顺序性、鉴权、ACL在写入前对 PII 做 redact如用 Model Armor。 热路径优化把会话过滤/压缩作为发送给模型前的标准步骤尽量减少网络传输与 token 花费。3.1 Variance across frameworks and models不同 agent 框架例如 ADK、LangGraph对 session/event/state 的表示与可变性差异显著——有的把 Session 作为独立对象ADK有的把整个 state 当作 sessionLangGraph。这些实现差异影响 compaction、互操作与迁移成本。核心要点 ADK显式 Session objectevents state LangGraphstate 即 session且可变非 append-only方便在内部做 compaction/转换。 框架抽象是“翻译器”——将内部事件映射为模型接受的 Contentrole parts减少 vendor lock-in。经验 / 实战技巧 选择框架时考虑“会话导出/迁移能力”与“事件模型可读性”以便未来跨框架互通或数据回放。 如果需跨框架互操作优先把语义数据memory中心化而非直接共享框架专用的会话 blob。Figure 2: Flow of context management for agents3.2 Sessions for multi-agent systems多 agent 系统中会话历史的管理有两种主流模式共享统一历史single shared log与独立私有历史 显式通信每 agent 保持私有日志通过明确消息交换。白皮书指出选择取决于任务耦合度与审计需求。核心要点共享历史所有 agent 写入同一 chronology log适合强耦合任务单一真相。可在 sub-agent 传递前做过滤/标注。独立历史 A2A / Agent-as-a-Tool每 agent 保留私有日志仅通过明确 message / tool 调用交换最终输出便于隔离与审计。A2A 协议支持跨框架消息传递。经验 / 实战技巧 对安全/合规高的场景含敏感数据优先采用“独立历史 明确接口”模式并在 agent-to-agent 通信中加验证与签名。 对高度协作、步骤链式的任务如复杂规划采用共享历史以保证可追踪的单一事件流但同时在日志中标注 agent 来源与敏感度。Figure 3: Different multi-agent architectural patterns3.2.1 Interoperability across multiple agent frameworks不同框架的内部数据模型导致持久化的会话记录不可直接互读。解决方案是把共享知识抽象为框架中立的 Memory 层——用 canonical简单字符串/字典表示的记忆实现跨框架互操作。核心要点Session storage 通常耦合框架内部 schema直接移植成本高Memory 层作为语义中介能实现真正的跨框架协作。经验 / 实战技巧在多框架系统设计早期就引入 memory managerframework-agnostic把共享事实/实体写入 memory 而不是会话事件。这样后续 agent 可用统一 API 检索。3.3 Production Considerations for Sessions生产化需关注三大领域——安全与隐私、数据完整性与生命周期、性能与可扩展性。白皮书推荐使用 managed session stores 并采取 TTL、ACL、PII redact 等措施。核心要点 安全/隐私严格隔离session-level ACL、鉴权/授权、对 PII 在写入前做 redact。 数据完整性保证事件的确定性顺序、定义保留/归档/删除策略TTL。 性能会话是热路径读取/写入必须低延迟采用过滤/压缩策略减少传输体积。经验 / 实战技巧在写会话前运行 PII 探测与 redactModel Armor 等工具并将该流程纳入 CI。设计 session store 的分层缓存本地短期 cache 中央持久层以降低热路径延迟。3.4 Managing long context conversation: tradeoffs and optimizations随着对话增长token 成本、延迟和“context rot”会影响质量。白皮书列出常见 compaction 策略sliding window、token-based truncation、recursive summarization与触发机制count/time/event。并强调昂贵操作应后台异步执行并持久化结果。核心要点三大策略保留最近 N turns、基于 token 截断、递归摘要对旧段落自动摘要并替换。触发机制计数token/turn、时间非活跃、事件语义/任务完成。异步化递归 summarization 等昂贵操作必须在后台运行并将摘要持久化同时记录摘要覆盖的原始事件以便溯源。经验 / 实战技巧推荐“滑动窗口 后台递归摘要”组合热路径仅发送最近 N turns后台并行生成并持久化旧段摘要必要时在上下文中注入摘要。记录 compaction 元数据包含哪些事件被摘要、摘要版本以便审计与可回溯。4、MemoryMemory 是从会话与其他数据源中提取并持久化的“有意义信息片段”用于跨会话的个性化、上下文管理与 agent 自我改进。Memory 管理器Memory Bank 等负责 extraction、consolidation、storage 与 retrieval。核心要点总体Memory 与 RAG 的区别RAG 面向静态事实库sharedMemory 面向用户特定、动态信息isolated per-user。两者互补。Memory 的基本单元包含 content结构化或非结构化与 metadataid、owner、source、timestamp、confidence。Memory 管理需关注 provenance溯源、confidence置信度、合并/冲突解决与遗忘pruning / TTL。经验 / 实战技巧总体 优先把频繁精确查询的字段用结构化 profile 保存快速查找复杂语义关联用 collection vector search。 对 memory 的每条记录保留 source_typebootstrapped / user / tool与 confidence用作合并与推理权重化。4.1 Types of memory按形式与功能可分多类结构化 vs 非结构化声明性declarative“知道什么” vs 程序性procedural“知道如何”按 scope 分为 user-level、session-level、application-level。核心要点 声明性what事实、偏好、实体。常用于个性化回复。 程序性how工作流或 playbook辅助 agent 决策与行动序列更接近“技能”。白皮书指出管理程序化记忆需要专门流程。 多模态多数 memory managers 将多模态输入转换成文本洞见保存对于直接保存二进制媒体需严格访问控制。经验 / 实战技巧把用户偏好等高价值字段存为结构化 profile快速注入 system prompt对程序性记忆设计专门 schema 并保持可执行/可审计。4.1.1 Types of information4.1.2 Organization patterns4.1.3 Storage architectures4.1.4 Creation mechanisms4.1.5 Memory scope4.1.6 Multimodal memory4.2 Memory Generation: Extraction and ConsolidationMemory 生成是一个 LLM 驱动的 ETLIngest → Extract/Filter → Consolidate → Store。Extraction 用 topic definitions / schema / few-shot 指导 LLM 提取。Consolidation 负责去重、冲突解决、合并或删除。核心要点 Extraction用 JSON schema / topic definitions / few-shot 示例引导 LLM 精准提取“有意义”信息按 agent 目的定制。 Consolidation检索相似记忆并通过 LLM 决定 UPDATE/CREATE/DELETE保持语义一致性与演化。 Pipeline内置 memory managerAgent Engine Memory Bank 等可自动化上述流程并提供 API背景/异步执行。经验 / 实战技巧 为关键话题准备 few-shot 示例与 schema提升抽取准确率并降低噪声。 Consolidation 阶段记录溯源哪些源贡献、时间、confidence并把删除/更新操作作为事务执行以保持一致性。4.2.1 Deep-dive: Memory Extraction4.2.2 Deep-dive: Memory Consolidation4.2.3 Memory Provenance4.2.3.1 Accounting for memory lineage during memory management4.2.3.2 Accounting for memory lineage during inference4.2.4 Triggering memory generation4.2.4.1 Memory-as-a-Tool4.2.4.2 Background vs. Blocking Operations4.3 Memory Retrieval检索目标不是简单相似匹配而是多维评分语义相关度 recency importance provenance/confidence。检索时机可为预检每 turn 加载或按需Memory-as-a-Tool。核心要点多维排序仅靠向量相似度会导致旧或琐碎记忆被召回需加 recency/importance/provenance。Timing预检保证连贯但增加延迟按需检索更节省但 agent 需有能力判定何时检索并可能增加额外 LLM 调用。经验 / 实战技巧 使用“静态少量注入 按需深检”的混合策略热路径注入最关键信息其余 memory 用按需工具拉取。 对于 collection 型 memory训练或微调专用 retriever如向量检索器或基于标签的检索能提升 RecallK 与质量。4.3.1 Timing for retrieval4.4 Inference with Memories记忆在推理时可注入为 system instructions、conversation history、或作为 tool output。白皮书分析了各自利弊system 指令控制性强但不支持 memory-as-a-tool直接注入对话可能造成注入/角色混淆。核心要点System Instruction 注入适合行为/persona 调整但不易动态触发 memory-as-a-tool。Conversation History 注入简单直观但会增加 token 并可能引发“对话注入”模型把 memory 当作实际对话语句。经验 / 实战技巧 对事实型短 memory 放在 System Instructions并标注 confidence对程序性或工具执行流程把 memory 作为 procedural injection 或提前加载。 将低置信或敏感 memory 降权或不直接展示给用户改由模型在内部权衡使用注入时带 confidence 元数据。4.4.1 Memories in the System Instructions4.4.2 Memories in the Conversation History4.5 Procedural memories程序性记忆“如何做”不同于声明性记忆其提取、合并与使用更接近行为/策略管理能让 agent 在线改进决策而无需 fine-tuning。提取/合并流程需要专门设计。核心要点提取需要专门 prompt 模板来把成功交互转化为可重复的 playbook。合并聚合成功策略、去除失败步骤并维护最佳实践库。经验 / 实战技巧对关键业务流程如“下单流程”定义结构化 procedural schema并周期性用 RLHF / 仿真数据验证其有效性。4.6 Testing and EvaluationMemory 系统需要多层评估memory 生成质量precision/recall/F1、检索性能RecallK、latency、以及端到端任务成功率LLM judge 人工复审。白皮书强调将用户负反馈自动化为回归测试用例。核心要点 生成质量用人工标注的 golden set 做 precision/recall 测评。 检索指标RecallK、检索延迟是关键需在严格的 latency budget 内。 端到端最终以任务成功度量系统是否因 memory 而变好。经验 / 实战技巧 把用户负反馈thumbs-down / error tickets自动转为回归测试用例并纳入 CI避免记忆回归导致用户体验下降。4.7 Production considerations for Memory生产化关注安全/隐私PII、溯源与删除请求、性能检索延迟、缓存、一致性并发合并/事务与成本生成频率。白皮书建议 memory 生成大多异步执行并维护详尽的 provenance 链路。核心要点 隐私在写入前 redact PII对用户撤回请求提供再生成或精确删除策略避免过度删除。 效率memory generation 以后台异步为主避免阻塞响应并避免重复处理同样事件。 溯源每条 memory 应记录来源、时间与置信度用于合并与推理时权衡。经验 / 实战技巧 实施 per-source lineage 跟踪当某数据源被撤回仅重建受影响的 memories替代全删。这虽昂贵但更精确。 对高成本场景采用混合触发事件驱动 周期性批处理来平衡新鲜度与成本。4.7.1 Privacy and security risks5、ConclusionContext Engineering 是实现有状态 agent的核心工程实践——它把 prompt engineering 扩展为“动态、分层且可治理的上下文构造”。Sessions 与 Memory各司其职且相互依赖Sessions 管理短期事件与工作 stateMemory 负责跨会话持久化与个性化。两者的分层设计利于多 agent 协作与跨框架互操作。工程实践侧重点把昂贵操作异步化在热路径严格控制 token 与 latency用 schema/few-shot 提高 memory 抽取精准度对生产系统实施强鉴权、PII redact、溯源与审计。治理与互操作跨框架协作建议以 framework-agnostic memory 为交换层同时对多 agent 消息/工具调用实施严格信任与权限控制。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询