2026/1/14 8:50:45
网站建设
项目流程
哪些网站做的比较好看,中小企业微网站建设,wordpress 站内通知,网上商城网站名称文章介绍了Agent开发的12个核心原则#xff0c;强调Agent不同于传统软件#xff0c;通过目标和规则实现实时决策。重点在于提示词和上下文工程#xff0c;开发者需掌控提示词和上下文窗口#xff0c;避免过度封装的AI框架。应构建小型专注的Agent#xff0c;将其设计为无状…文章介绍了Agent开发的12个核心原则强调Agent不同于传统软件通过目标和规则实现实时决策。重点在于提示词和上下文工程开发者需掌控提示词和上下文窗口避免过度封装的AI框架。应构建小型专注的Agent将其设计为无状态函数通过简单API实现启动/暂停/恢复利用工具调用与人类交互并将错误信息注入上下文实现自我修复。灵活控制流和统一状态管理是构建高效Agent的关键。前言本文来自于对 Agent 12 原则的总结。总结后感受如下Agent 是软件但不同于传统软件需要工程师编写每个步骤和边缘情况Agent 只需要给出目标和一组规则通过 Agent 实时决策以确定执行路径从而达成最后目标。Agent 给软件开发带来的改变Agent 允许工程师编写更少的控制型代码只需要将“图的边Edge”提供给 LLM让他自行决策下一步执行节点。Agent 开发中最重要的是提示词和上下文工程这是工程师与 LLM 交互的核心方式。过度封装的 AI 框架不一定带来好的性能只有具备足够的灵活性你才可以针对特定用例尝试出最好的结果。顶尖 1% 的 AI 应用与其余 99% 的 AI 应用的构建方式都不相同。达到 80% 的质量标准很容易但对大多数用户来说80% 是不够的要想提升到 80% 以上就需要对框架、提示词、流程等进行逆向工程从头开始。01-自然语言到工具调用Natural Language to Tool Calls**原则**Agent 的核心模式之一是将自然语言转换为结构化的工具调用。Agent 内部的 LLM 负责对自然语言进行解析生成结构化的数据以描述要调用的工具之后由确定性代码进行工具调用。02-掌控你的提示词Own your prompts**原则**不要将你的提示词外包给框架否则难以通过逆向工程对提示词调优将更合适的 token 喂给模型。**重要性**提示词是应用与 LLM 交互的关键接口。像对待核心代码一样对提示词进行版本化、测试和维护。优势完全控制精确编写 Agent 所需指令无需黑盒抽象。测试和评估像对待其他代码一样为你的提示词构建测试和评估。迭代根据实际反馈快速修改提示词。透明确切知道你的 Agent 正在执行的具体指令。灵活性可以尝试奇怪的非标准提示词玩法以模型达到最佳性能为目的。03-掌控你的上下文窗口Own your context window**原则**在任何时候你向 Agent 里的 LLM 输入的内容都是“到目前为止发生了…下一步是…”。**重要性**LLM 是无状态函数要想获取最佳输出就需要提供最佳输入。掌控你的上下文窗口不一定要使用基于标准消息的格式向 LLM 传递上下文只要具备足够的灵活性你就可以尝试一切直到获取最佳输出。出色的上下文要具备提供给模型的提示词和指令。检索到的任何文档和外部数据例如 RAG。任何过去的状态、工具调用、结果或其他历史记录。来自相关但彼此独立的历史对话中的消息或事件记忆。指定需要输出的结构化数据类型。灵活性Agent 与 LLM 通常使用标准的消息交互格式分为 SystemMessage、UserMessage、AssistantMessage、ToolMessage[ { role: system, content: You are a helpful assistant... }, { role: user, content: Can you deploy the backend? }, { role: assistant, content: null, tool_calls: [ { id: 1, name: list_git_tags, arguments: {} } ] }, { role: tool, name: list_git_tags, content: {\tags\: [{\name\: \v1.2.3\, \commit\: \abc123\, \date\: \2024-03-15T10:00:00Z\}, {\name\: \v1.2.2\, \commit\: \def456\, \date\: \2024-03-14T15:30:00Z\}, {\name\: \v1.2.1\, \commit\: \abe033d\, \date\: \2024-03-13T09:15:00Z\}]}, tool_call_id: 1 }]标准的消息交互格式可以满足绝大多数场景但是如果你想要真正充分利用 LLM就需要以最节省 token 和注意力的方式将上下文输入 LLM。相比于标准的交互格式可以尝试针对你的用例进行优化构建自定义的上下文格式。下边是将整个上下文窗口都放入 UserMessage 内部的示例[ { role: system, content: You are a helpful assistant... }, { role: user, content: | Heres everything that happened so far: slack_message From: alex Channel: #deployments Text: Can you deploy the backend? /slack_message list_git_tags intent: list_git_tags /list_git_tags list_git_tags_result tags: - name: v1.2.3 commit: abc123 date: 2024-03-15T10:00:00Z - name: v1.2.2 commit: def456 date: 2024-03-14T15:30:00Z - name: v1.2.1 commit: ghi789 date: 2024-03-13T09:15:00Z /list_git_tags_result whats the next step? }]优势信息密度以最大化 LLM 理解的方式构建信息。错误处理以有助于 LLM 从错误中恢复的方式去包含错误信息。考虑在错误解决后将其上下文窗口隐藏减少无用信息安全性控制传递给 LLM 的信息过滤掉敏感数据。灵活性根据你用例的最佳实践调整上下文的格式。Token 效率优化上下文格式以提高 Token 使用效率和 LLM 理解。如下图以 XML 格式自定义消息可以实现更高的信息密度相同的信息左侧占用 87 token、右侧占用 57 tokenimg04-工具只是结构化输出Tools are just structured outputs**原则**工具不需要很复杂工具的本质是来自于 LLM 的结构化输出。❝工具的本质是通过 LLM 选择工具触发确定性代码最终得到结构化输出。举例假设你有两个工具CreateIssue和SearchIssue要求 LLM 选择一个工具调用。本质其实就是先让 LLM 输出结构化数据用于表示选择的工具之后再通过确定性代码去调用 LLM 选择的工具。05-统一执行状态和业务状态Unify execution state and business state**原则**统一执行状态和业务状态。对于 AI 应用如果要对执行状态和业务状态进行分离来跟踪当前步骤、下一步、等待状态、重试计数等这可能涉及到复杂的抽象虽然可能是值得的但对你的用例来说可能有些“重”了。分离会带来复杂性如果可能尽可能简化并统一这些内容执行状态当前步骤、下一步、等待状态、重试次数等。业务状态Agent 工作流到目前为止发生的事情例如消息列表、工具调用和结果等。实际上可以通过设计应用仅凭上下文窗口就能推断出全部的执行状态。大多数情况下执行状态当前步骤、等待状态等只是目前为止发生的事情的元数据。小部分情况下有一些内容无法放入上下文窗口如会话 ID、密码上下文等但你的目标应该是尽量减少这类内容。优势简洁性为所有状态提供单一事实来源。序列化线程可以轻松地进行序列化/反序列化。调试完整的历史记录在同一处可见。灵活性仅通过添加新的时间类型即可轻松新增状态。恢复仅需加载线程即可从任意点恢复。分叉通过将线程的子集复制到新的上下文可在任意时刻分叉线程。人机界面与可观测性可轻松将线程转换为人类可读的 Markdown 或 Web 应用界面。06-通过简单的API实现启动/暂停/恢复Launch/Pause/Resume with simple APIs**原则**Agent 就是程序要像普通服务一样能够通过简单的 API 实现启动、暂停、恢复和停止。暂停当需要执行长耗时任务智能体应该能够暂停。恢复外部触发器例如 webhook应当能够让 Agent 从中断处恢复而无需与 Agent 编排器深度耦合。07-通过工具调用与人类联系Contact humans with tool calls**原则**让 LLM 通过工具调用与人类进行交互从而始终输出结构化数据。该原则建议 Agent 与人类交互时不要只是简单地向控制台输出“我已完成任务”等纯文本内容而是使用工具调用始终输出结构化数据。该原则可能不会带来任何性能提升但你应该尝试一些奇怪的方法以获取最佳结果。灵活性优势清晰的指令不同类型的人类交互“工具”能让 LLM 更准确地表达意图输出内容结构化。内循环和外循环支持不同于 ChatGPT 风格的代理工作流程。❝外循环 AgentAgent 启动后执行一系列任务任务耗时较长当他们需要帮助时会主动联系人类例如高风险任务中会寻求人工审批。外循环文章https://theouterloop.substack.com/p/openais-realtime-api-is-a-step-towards多人访问可以通过结构化时间轻松跟踪并协调来自不同人类的输入。多代理简单的抽象可轻松扩展以支持Agent - Agent的请求和响应。持久耐用与 Factor-06 结合可构建持久、可靠且可内省的多人工作流。08-掌控你的控制流Own your control flow**原则**构建符合你特定用例的控制结构。掌控并自定义控制结构以下是几种控制流模式的示例请求澄清模型请求更多的信息跳出循环并等待人类的回复。拉取 Git 标签模型请求 Git 标签列表并将其放入上下文窗口然后返回给模型。部署后端服务模型被请求部署后端服务这是高风险任务因此需要中断循环并等待人工批准。例如- 对于所有的 AI 框架我最重要的功能诉求是我们需要能够中断一个正在工作的 Agent并在之后恢复尤其是在选择工具和调用工具的时候。如果没有这种级别的可恢复性控制就无法在工具调用前进行审查或批准。09-将错误信息压缩到上下文窗口Compact Errors into Context Window**原则**将错误信息注入上下文供 LLM 理解学习并在后续任务中进行修复。Agent 的优势之一是自我恢复当工具调用出现错误时把错误信息注入上下文供 LLM 理解并修复这种方式需要为特定工具实现错误计数当达到尝试次数上限时例如 3 次考虑将错误上报人工处理。不一定要将原始错误放回去你完全可以重构它的表示方式。优势自我修复LLM 可以读取错误信息并在后续工具调用中修复。持久性即使一次工具调用失败Agent 也能继续运行。10-小型、专注的 AgentSmall, Focused Agents**原则**与其构建试图包揽一切的庞然大物不如构建小型、专注的 Agent。随着上下文的扩展 LLM 更容易迷失方向。❝注意力稀缺性源于 LLM 的架构限制LLM 基于 transformer 架构该架构允许每个 token 关注上下文中的所有其他 token如果有 n 个 token就会存在 n^2 个成对关系。随着上下文长度增加模型捕捉成对关系的能力逐渐下降从而在上下文长度和注意力集中度之间产生矛盾。优势可管理的上下文更小的上下文窗口意味着更好的 LLM 性能。职责明确每个 Agent 都有明确的职责范围和目标。更高的可靠性更不容易在复杂的工作流中迷失方向。更易于测试更容易测试和验证特定功能。调试改进问题发生时更容易识别并修复。11-随时随地触发满足用户需求Trigger from anywhere, meet users where they are**原则**允许用户通过任何渠道触发 Agent同时Agent 以相同的渠道进行回复。优势在用户所在的场景触达用户这有助于你构建更像真人、或至少像数字同事的 AI 应用。外循环代理允许代理由非人类因素触发如事件、定时任务、故障等。它们可以工作5、20、90 分钟但在到达关键节点时可以联系人工寻求帮助、反馈或审批。高风险工具如果你能快速将各种人员纳入闭环就可以赋予 Agent 更高风险的操作权限例如发送外部电子邮件、更新生产环境数据等。通过明确的规范确保全程可审计并增强12-把你的 Agent 设计为无状态函数Make your agent a statelessreducer**原则**把你的 Agent 设计为无状态函数。Agent 其实只包含两个部分通过 LLM 决定下一步。将结果放入上下文窗口。循环…Agent 仅此而已过度抽象封装的 AI 框架会带来更多的复杂度、更高的学习成本并且会降低开发者的灵活性。2025年伊始AI技术浪潮汹涌正在深刻重塑程序员的职业轨迹阿里云宣布核心业务全线接入Agent架构字节跳动后端岗位中30%明确要求具备大模型开发能力腾讯、京东、百度等技术岗位开放招聘约80%与AI紧密相关……大模型正推动技术开发模式全面升级传统的CRUD开发方式逐渐被AI原生应用所替代眼下已有超60%的企业加速推进AI应用落地然而市场上能真正交付项目的大模型应用开发工程师却极为短缺实现AI应用落地远不止写几个提示词、调用几个接口那么简单。企业真正需要的是能将业务需求转化为实际AI应用的工程师这些核心能力不可或缺✅RAG检索增强生成为模型注入外部知识库从根本上提升答案的准确性与可靠性打造可靠、可信的“AI大脑”。✅Agent智能体 赋能AI自主规划与执行通过工具调用与环境交互完成多步推理胜任智能客服等复杂任务。✅微调如同对通用模型进行“专业岗前培训”让它成为你特定业务领域的专家。大模型未来如何发展普通人如何抓住AI大模型的风口随着AI技术飞速发展大模型的应用已从理论走向大规模落地渗透到社会经济的方方面面。技术能力上其强大的数据处理与模式识别能力正在重塑自然语言处理、计算机视觉等领域。行业应用上开源人工智能大模型已走出实验室广泛落地于医疗、金融、制造等众多行业。尤其在金融、企业服务、制造和法律领域应用占比已超过30%正在创造实实在在的价值。未来大模型行业竞争格局以及市场规模分析预测:掌握AI能力的程序员其薪资水位已与传统开发拉开显著差距。当大厂开始优化传统岗位时却为AI大模型人才开出百万年薪——而这在当下仍是一将难求。技术的稀缺性才是你「值钱」的关键AI浪潮正在重构程序员的核心竞争力不要等“有AI项目开发经验”成为面试门槛的时候再入场错过最佳时机那么我们如何学习AI大模型呢在一线互联网企业工作十余年里我指导过不少同行后辈经常会收到一些问题我是小白学习大模型该从哪里入手呢我自学没有方向怎么办这个地方我不会啊。如果你也有类似的经历一定要继续看下去这些问题也不是三言两语啊就能讲明白的。所以呢我专为各位开发者设计了一套全网最全最细的大模型零基础教程从基础到应用开发实战训练旨在将你打造成一名兼具深度技术与商业视野的AI大佬而非仅仅是“调参侠”。同时这份精心整理的AI大模型学习资料我整理好了免费分享只希望它能用在正道上帮助真正想提升自己的朋友。让我们一起用技术做点酷事ps:微信扫描即可获取加上后我将逐一发送资料与志同道合者共勉真诚无偿分享※大模型全套学习资料展示通过与MoPaaS魔泊云的强强联合我们的课程实现了质的飞跃。我们持续优化课程架构并新增了多项贴合产业需求的前沿技术实践确保你能获得更系统、更实战、更落地的大模型工程化能力从容应对真实业务挑战。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。Part 1 大模型系统化学习路线作为学习AI大模型技术的新手方向至关重要。 正确的学习路线可以为你节省时间少走弯路方向不对努力白费。希望这份最科学最系统的学习成长路线图和学习规划带你从零基础入门到精通微信扫描下方二维码即可~本教程比较珍贵仅限大家自行学习不要传播更严禁商用Part2 全套AI大模型应用开发视频教程包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点。剖析AI技术的应用场景用实战经验落地AI技术。从GPT到最火的开源模型让你从容面对AI技术革新01 大模型微调掌握主流大模型如DeepSeek、Qwen等的微调技术针对特定场景优化模型性能。学习如何利用领域数据如制造、医药、金融等进行模型定制提升任务准确性和效率。02 RAG应用开发深入理解检索增强生成Retrieval-Augmented Generation, RAG技术构建高效的知识检索与生成系统。应用于垂类场景如法律文档分析、医疗诊断辅助、金融报告生成等实现精准信息提取与内容生成。03 AI Agent智能体搭建学习如何设计和开发AI Agent实现多任务协同、自主决策和复杂问题解决。构建垂类场景下的智能助手如制造业中的设备故障诊断Agent、金融领域的投资分析Agent等。Part3 大模型学习书籍文档新手必备的权威大模型学习PDF书单来了全是一系列由领域内的顶尖专家撰写的大模型技术的书籍和学习文档电子版从基础理论到实战应用硬核到不行※真免费真有用错过这次拍大腿Part4 AI大模型最新行业报告2025最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。Part5 大模型项目实战配套源码学以致用热门项目拆解在项目实战中检验和巩固你所学到的知识同时为你找工作就业和职业发展打下坚实的基础。学完项目经验直接写进简历里面试不怕被问Part6 AI产品经理大模型大厂面试真题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我精心整理了一份大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。最后如果你正面临以下挑战与期待渴望转行进入AI领域顺利拿下高薪offer即将参与核心项目急需补充AI知识补齐短板拒绝“35岁危机”远离降薪裁员风险持续迭代技术栈拥抱AI时代变革创建职业壁垒……那么这份全套学习资料是一次为你量身定制的职业破局方案ps:微信扫描即可获取加上后我将逐一发送资料与志同道合者共勉真诚无偿分享与其焦虑……不如成为「掌握AI大模型的技术人」毕竟AI时代谁先尝试谁就能占得先机最后祝大家学习顺利抓住机遇共创美好未来