2026/1/3 3:19:02
网站建设
项目流程
做网站必须要有前台吗,张戈博客wordpress主题,如何做英文网站的外链,黄页堆广相信大家都曾经使用过大语言模型#xff08;LLM#xff09;#xff0c;那你很可能听说过“提示词工程#xff08;prompt engineering#xff09;”。在早期#xff0c;想要获得理想的输出结果#xff0c;关键就是设计出一个完美的提示词。
对于一些简单的聊天机器人或文…相信大家都曾经使用过大语言模型LLM那你很可能听说过“提示词工程prompt engineering”。在早期想要获得理想的输出结果关键就是设计出一个完美的提示词。对于一些简单的聊天机器人或文本生成任务这种方式通常已经足够。但随着我们开始构建更加复杂的 AI 系统——例如能够使用工具、记住对话内容、并与外部世界交互的智能体——人们很快意识到仅靠一个提示词已经远远不够。这促使我们对与大语言模型的交互方式进行了重新思考从简单的“写提示词”转向了“构建上下文”的系统性设计。本文将带你回顾这一转变的历程从简单提示词到丰富且动态的上下文结构。我们将探讨提示词工程中曾经奏效的核心技巧分析它所面临的局限性并介绍一门新的关键技术——上下文工程Context Engineering。这项技术正是当下构建健壮、可扩展、真正智能 AI 系统的核心所在。提示词工程的演变要理解我们今天所处的位置必须从最初的发展讲起。最早用于引导大语言模型的技术虽然简单却非常有效也为后续的一切创新打下了基础。基础Zero-Shot 与 Few-Shot 提示与大语言模型交互最基本的方式就是零样本提示Zero-Shot Prompting。也就是说你直接给模型一个任务指令但不提供任何示例。这种方式完全依赖模型在预训练过程中学到的知识来完成任务。零样本提示虽然简单易用但它的表现往往不够稳定。为了提高输出的可靠性我们可以采用少样本提示Few-Shot Prompting。这种方式不是单纯告诉模型“要做什么”而是通过在提示词中加入几个示例来“示范”应该怎么做。这种做法本质上就是一种“上下文学习”In-Context Learning模型从你提供的示例中学习所需的格式、风格和任务逻辑从而生成更符合预期的输出。这张图清晰对比了 Zero-Shot 与 Few-Shot 提示的差异。在左侧的“Zero-Shot Prompting”部分只有一条简短的指令请求大语言模型对一条影评进行分类。模型在没有任何示例的情况下直接输出了“Negative负面”。而在右侧的“Few-Shot Prompting”部分除了相同的任务指令外还提前提供了两个完整的示例一个正面影评对应“Positive”一个中性影评对应“Neutral”。接着再展示目标影评。模型结合前面的示例后再次输出“Negative负面”。这个视觉对比很好地突出了两种方式的核心区别Zero-Shot 是完全不依赖示例的“裸提示”而 Few-Shot 则通过示例引导模型理解任务属于更具上下文信息的交互方式。—点击上方名片关注AI拍档—进化思维链提示Chain-of-Thought让推理过程显性化对于一些简单任务提供示例已经足以帮助模型理解该怎么做。但如果面对的是需要多步推理的问题仅靠示例还不够我们还需要让模型“思考”。于是出现了“思维链提示”Chain-of-Thought Prompting这一技巧的核心思想是引导模型逐步思考将一个复杂问题拆解为一系列中间推理步骤。我们在提示词中明确地要求模型“step by step一步一步地思考”通过这种方式不仅提升了模型解决复杂逻辑问题的能力也让推理过程更加透明可控。这张图展示了如何通过“思维链提示”Chain-of-Thought Prompting来引导模型解决一道数学文字题。用户提出的问题是“一个杂技演员有 16 个球其中一半是高尔夫球这些高尔夫球中又有一半是蓝色的。那么蓝色高尔夫球有多少个” 提示词中的关键语句是“Let’s think step by step让我们一步一步地想”。大语言模型的输出是一份结构清晰的推理列表首先计算高尔夫球的数量16 ÷ 2 8。接着计算蓝色高尔夫球的数量8 ÷ 2 4。最后得出结论共有 4 个蓝色高尔夫球。这个例子直观展示了思维链提示的价值通过要求模型逐步思考我们可以获得更清晰、有逻辑、过程透明的推理结果。通过让推理过程显性化思维链提示Chain-of-Thought, CoT在需要逻辑推理、算术运算或步骤规划的任务中大大提升了模型的准确性。进化思维树Tree of Thoughts探索多条推理路径思维链Chain-of-Thought是一种强大的线性推理方式但现实中的许多问题并不总是只有一条明确的解题路径。这就促使人们进一步发展出“思维树”Tree of Thoughts, 简称 ToT方法。与线性推进的 CoT 不同ToT 允许模型同时探索多条推理路径就像一棵决策树一样在多个可能的解法之间分支展开。通过这种结构化的推理方式模型不仅可以更全面地考虑问题还能在多个选项中权衡选出更优的答案。这是一张概念图用于对比“思维链Chain-of-Thought, CoT”与“思维树Tree of Thoughts, ToT”两种推理方式。图的左侧展示了 CoT 的结构一条简单的、线性的思维路径从初始问题逐步推进最终得出一个明确答案。而图的右侧则是 ToT 的结构从一个初始思路出发向外分裂成多条潜在的推理路径形成一个类似决策树的分支结构。每条路径都代表一种可能的推理方向模型可以在这些路径中探索、评估最终选择最合理的答案。这张图很好地突出了两者的核心区别CoT 是单线推进ToT 则是多路并行探索。ToT 的出现为模型在面对复杂、多解问题时提供了更强的思考能力。思维树Tree of Thoughts能够对不同的思路进行评估并选择其中最有前景的一条。这在面对存在多种可行解法或最优解路径并不明显的问题时格外有用。相比于线性推进的思维链Chain-of-Thought这种方式无疑是一种重要的进化为复杂问题的求解打开了全新的可能性。值得一提的是思维链本身也衍生出了多个变体每一种都在不同维度上对推理能力进行了扩展与优化。使用 RAG 将模型接入外部知识实现事实对齐大语言模型的内部知识是静态的它无法主动更新也无法访问你的企业私有数据或实时新闻。为了弥补这一缺陷我们可以使用一种方法检索增强生成Retrieval-Augmented Generation简称 RAG。RAG 的核心思路是在模型生成回答之前先从外部知识库中检索出相关信息然后将这些最新的、真实的数据作为上下文提供给模型从而让它生成更有依据、更贴近现实的回答。通过这种方式我们可以让模型“接地气”实现基于事实的生成而不是仅仅依赖训练时学到的“记忆”。这对于构建真正实用、可信的 AI 系统至关重要。这张图直观展示了 RAG检索增强生成 的工作流程流程从用户提问开始例如“我们第二季度的营收是多少”接着一条箭头指向“向量数据库”表示系统会根据这个问题去执行搜索操作。随后系统从数据库中检索出相关的文档片段比如“Q2 财报净营收为 500 万美元……”这些文档片段会与原始提问以及系统指令一起被拼接成一个完整的上下文。这个上下文再被输入到大语言模型中最终生成基于真实数据的回答例如“我们第二季度的净营收是 500 万美元。”整张图清晰地区分了两个关键阶段检索Retrieval 和 生成Generation。 正是这种检索 生成的组合让模型能够“知今知彼”实现事实依据更强、时效性更高的回答。ReAct让大语言模型具备“动手能力”虽然 Chain-of-Thought 和 Tree of Thoughts 主要关注模型的内部推理过程但现实中的许多问题往往还需要模型与外部的信息源或工具进行交互。为了解决这一需求研究者提出了 ReAct 框架Reason and Act。ReAct 的核心思想是让大语言模型不仅会“思考”Reason还能“行动”Act。 在这个框架中模型会先思考下一步该做什么然后通过使用外部工具如搜索引擎、计算器或 API来执行操作接着观察结果再据此进行下一步的思考。这种“思考 → 行动 → 观察 → 再思考”的循环机制使模型能够动态获取信息、执行指令、与世界互动从而胜任那些需要外部数据或实际操作能力的复杂任务。 换句话说ReAct 让语言模型从“只会说”进化为“能说会做”迈出了通往通用智能的关键一步。这张图展示了 ReAct 框架Reason and Act 的完整工作流程。整个流程从用户提出问题开始。模型接收到用户问题后会先生成一个“思考”Thought并决定调用某个“工具”Tool来获取信息或执行操作。工具执行完操作后系统会返回一个“观察结果”Observation这被反馈给模型。模型据此继续思考可能再次决定使用另一个工具。这个“思考 → 行动 → 观察”的循环可以持续多轮直到模型获取了足够的信息最终生成对用户问题的“最终回答”Final Answer。这张图清晰地描绘了 ReAct 的核心机制将推理过程与外部行动结合起来让语言模型像一个智能体一样具备自主决策、主动操作和动态调整的能力从而可以解决更复杂、更开放的问题。Function Calling工具使用方式的演进ReAct 是一项开创性的尝试它首次展示了大语言模型如何在“思考”之后调用外部工具开启了模型具备行动能力的先河。但随着各大 LLM 服务商逐渐意识到工具调用的重要性他们开始对模型进行专门的微调训练并设计出结构化的输出格式以提升调用工具的可靠性和精确性。这一演进过程催生了我们今天所熟知的 Function Calling函数调用 能力。Function Calling 不再依赖自然语言去触发操作而是通过明确的函数结构如函数名、参数字段等来规范模型与外部工具的交互大幅提升了稳定性和开发效率。值得一提的是ReAct 与 Chain-of-Thought 不仅推动了工具调用的发展还为如今的推理模型打下了基础。它们共同验证了一个关键理念明确地拆解思考步骤能显著增强模型解决问题的能力。这正是构建更强智能体和系统化 AI 的核心方向之一。 什么是 Function Calling函数调用Function Calling 是大语言模型的一项能力当你在上下文中提供了一组可用工具函数的描述后模型可以自主选择是否“调用”其中某个函数。 不同于传统的自然语言输出Function Calling 的结果是一个结构化的 JSON 对象其中明确指出要调用的函数名称以及对应的参数arguments 随后由你的应用代码来实际执行这个函数并将执行结果返回给模型继续处理。 这种机制让模型不仅能“说”还能通过规范化的接口“做”为构建可控、可扩展的 AI 应用提供了关键支撑。总结从最早的提示词工程到思维链、思维树、再到具备实际行动能力的 Function Calling我们已经走过了大语言模型交互方式的几个重要阶段。但这还只是开始。随着上下文信息越来越复杂我们该如何有条不紊地组织这些内容怎样才能让模型理解“我想让你做的事”。在下一篇中我们将继续深入——聊聊“现代上下文的结构化技巧”以及构建真正智能 AI 系统背后的“上下文工程”本质。想入门 AI 大模型却找不到清晰方向备考大厂 AI 岗还在四处搜集零散资料别再浪费时间啦2025 年AI 大模型全套学习资料已整理完毕从学习路线到面试真题从工具教程到行业报告一站式覆盖你的所有需求现在全部免费分享扫码免费领取全部内容一、学习必备100本大模型电子书26 份行业报告 600 套技术PPT帮你看透 AI 趋势想了解大模型的行业动态、商业落地案例大模型电子书这份资料帮你站在 “行业高度” 学 AI1. 100本大模型方向电子书2. 26 份行业研究报告覆盖多领域实践与趋势报告包含阿里、DeepSeek 等权威机构发布的核心内容涵盖职业趋势《AI 职业趋势报告》《中国 AI 人才粮仓模型解析》商业落地《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》领域细分《AGI 在金融领域的应用报告》《AI GC 实践案例集》行业监测《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。3. 600套技术大会 PPT听行业大咖讲实战PPT 整理自 2024-2025 年热门技术大会包含百度、腾讯、字节等企业的一线实践安全方向《端侧大模型的安全建设》《大模型驱动安全升级腾讯代码安全实践》产品与创新《大模型产品如何创新与创收》《AI 时代的新范式构建 AI 产品》多模态与 Agent《Step-Video 开源模型视频生成进展》《Agentic RAG 的现在与未来》工程落地《从原型到生产AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。二、求职必看大厂 AI 岗面试 “弹药库”300 真题 107 道面经直接抱走想冲字节、腾讯、阿里、蔚来等大厂 AI 岗这份面试资料帮你提前 “押题”拒绝临场慌1. 107 道大厂面经覆盖 Prompt、RAG、大模型应用工程师等热门岗位面经整理自 2021-2025 年真实面试场景包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题每道题都附带思路解析2. 102 道 AI 大模型真题直击大模型核心考点针对大模型专属考题从概念到实践全面覆盖帮你理清底层逻辑3. 97 道 LLMs 真题聚焦大型语言模型高频问题专门拆解 LLMs 的核心痛点与解决方案比如让很多人头疼的 “复读机问题”三、路线必明 AI 大模型学习路线图1 张图理清核心内容刚接触 AI 大模型不知道该从哪学起这份「AI大模型 学习路线图」直接帮你划重点不用再盲目摸索路线图涵盖 5 大核心板块从基础到进阶层层递进一步步带你从入门到进阶从理论到实战。L1阶段:启航篇丨极速破界AI新时代L1阶段了解大模型的基础知识以及大模型在各个行业的应用和分析学习理解大模型的核心原理、关键技术以及大模型应用场景。L2阶段攻坚篇丨RAG开发实战工坊L2阶段AI大模型RAG应用开发工程主要学习RAG检索增强生成包括Naive RAG、Advanced-RAG以及RAG性能评估还有GraphRAG在内的多个RAG热门项目的分析。L3阶段跃迁篇丨Agent智能体架构设计L3阶段大模型Agent应用架构进阶实现主要学习LangChain、 LIamaIndex框架也会学习到AutoGPT、 MetaGPT等多Agent系统打造Agent智能体。L4阶段精进篇丨模型微调与私有化部署L4阶段大模型的微调和私有化部署更加深入的探讨Transformer架构学习大模型的微调技术利用DeepSpeed、Lamam Factory等工具快速进行模型微调并通过Ollama、vLLM等推理部署框架实现模型的快速部署。L5阶段专题集丨特训篇 【录播课】四、资料领取全套内容免费抱走学 AI 不用再找第二份不管你是 0 基础想入门 AI 大模型还是有基础想冲刺大厂、了解行业趋势这份资料都能满足你现在只需按照提示操作就能免费领取扫码免费领取全部内容2025 年想抓住 AI 大模型的风口别犹豫这份免费资料就是你的 “起跑线”