自己建设网站百度搜索优化平台
2026/3/6 17:05:19 网站建设 项目流程
自己建设网站,百度搜索优化平台,沈阳网站建设信息,开发必备软件引入 将你的LLM从“读死书的书呆子”武装成“超级助理” 从22年底ChatGPT的爆火#xff0c;到今年年初国产大语言模型DeepSeekv3的频繁刷屏#xff0c;我们看到了大语言模型#xff08;LLM#xff09;那令人惊叹的能力#xff1a;写诗、编程、答疑仿佛无所不能#xff0c…引入将你的LLM从“读死书的书呆子”武装成“超级助理”从22年底ChatGPT的爆火到今年年初国产大语言模型DeepSeekv3的频繁刷屏我们看到了大语言模型LLM那令人惊叹的能力写诗、编程、答疑仿佛无所不能无所不知。其高度自然的人机交互界面容易让我们感觉像是在与一位“全知全能”的对话者交流。然而揭开这层表象LLM的核心本质是一个基于海量数据训练的“下一个词元概率预测模型”。他的核心任务非常简单就是根据上下文即你的问题从数十亿的参数中计算出下一个最可能出现的词元是什么。如此不断反复最终生成一个长文本。当然如果仅仅是一个简单的下一个词元的概率预测模型LLM也不会像现在这样火热。关键在于凭借其庞大的参数规模与训练数据量LLM显现了“涌现能力”Emergent Abilities也就是我们的俗语书读百遍其意自现——这意味着当模型规模超过某个临界点时它会展现出诸如复杂推理、逻辑分析、任务规划等并未在训练中被明确指定的新能力。因此LLM的能力呈现出一种二元性它是“白痴”从概率模型上讲他有三个局限知识滞后他的知识永远停留在训练截止日他无法获得在那以后的信息。知识幻觉由于本质是概率模型他总能选到概率很高的词也即一本正经的胡说八道。行动无能他无法和现实世界产生交互。但另一方面它是“天才”“涌现”让他拥有了卓越的推理与分解能力能够理解复杂问题并将其分解为可处理的子任务。强大的规划能力可以规划多步骤任务的执行路径。正是为了克服LLM的固有局限同时充分利用其强大的推理和规划能力Prompt工程、检索增强生成RAG、函数调用Function Calling和模型上下文协议MCP等技术应运而生。它们共同协作构成了当今火热无比的AI Agent智能代理。如下图所示我们可以将AI Agent想象为一个高效的超级助理LLM是助理的“大脑”负责核心的思考、推理与决策Prompt是清晰的“指令”明确告知助理需要完成的任务和目标RAG是助理的“动态知识库”使其能够访问和利用最新、专有的信息减少幻觉Function Calling是助理的“手脚”允许它调用各种函数和工具来执行具体操作MCP则是连接大脑与手脚的“神经系统”为工具调用提供标准化、可互操作的协议确保协作流畅接下来我们将初步了解Prompt、RAG、Function Calling和MCP这四大关键技术看看他们是如何工作的在下一篇文章中我将以一个我参加比赛的实际系统为例带你看看它们如何协同工作将一个简单的LLM武装成一个“数据超级助理”。一、Prompt提示词一切交互的基石1定义prompt提示词不是一种具体的技术是我们和LLM沟通的控制语言。他的构成就是指令式的语言这是整个Agent中的一个核心我们所有功能的实现都是基于一个我们精心设计好的提示词。2核心作用提示词的核心作用就玩一场cosplay。我们要精确的告诉模型“你是谁角色”、“你要做什么任务”、“依照什么样的规则约束”、“参考什么信息上下文非必须”以及示例非必须。LLM模型接受的训练数据是多种多样的所以在回答时他的答案边界就会很模糊Prompt的作用就是给模型画个圈让他的答案限制在这个圈内。3演示接下来让我们做一个简单的演示我们让模型来写一个关于狗的故事。「模型一」写一个300字左右的关于狗的故事「模型二」你是一位小说家你现在要用欧亨利的风格写一个300字左右的关于狗的故事。我们用腾讯元宝中的DeepSeek开启深度思考会有如下的结果「模型一」 vs 「模型二」可以看出两篇故事还是有很大的区别的。后一篇明显可以看出欧亨利的意料之外情理之中的结尾。4如何写好一个提示词那么我们应该如何写好一个提示词呢C - 清晰具体 (Clear Specific)避免使用模糊、笼统的词语。L - 提供背景 (Lay out Context)给出足够的上下文信息帮助 AI 理解任务的背景和目的。E - 明确目标 (Explicit Goal)清晰地说明你想要 AI 完成什么任务以及最终成果的用途。A - 指定格式 (Assign a Format)规定输出的格式、风格、语气和长度。在实践中我们可以用上面的基本原则加我们下面的基本公式来生成你的提示词角色 任务 背景 要求 格式/范例 小Tips在面对复杂的任务时可以尝试把它拆分成多个小步骤一步一步引导AI完成巧用思维链在处理设计推理和逻辑的问题的时候让AI一步步思考或者展示他的思考过程这样会使得最终的输出更加严谨准确。不要想着一蹴而就一个好的提示词是需要不断迭代更新的先从简单的开始然后给他添加正面和负面的例子再把例子抽象成新的指令一步一步完善你的提示词。二、两大核心外挂为LLM赋予“新知识”和“真行动”RAG———解决知识滞后和幻觉1定义RAGRetrieval-Augmented Generation检索增强生成是一种将信息检索和LLM结合的技术框架让LLM在回答问题前先从外部知识库内部数据库、PDF获取相关信息然后将查询到的信息注入到Prompt中利用LLM的总结能力来回答问题。如图所示RAG的调用流程共包含5个步骤用户提问检索器将用户的问题转化成向量知识库根据查询算法从向量数据库中搜索出最相关的几个知识片段将这些知识片段填入到提前编辑好的提示词中LLM根据提示词以及相关的知识片段利用自己的推理能力生成对用户提问的回答2Demo演示1 环境准备① 先安装必要的库pip install openai scikit-learn python-dotenv② 在项目文件夹中创建一个.env的文件填入你的LLM API这里使用硅基流动的API有免费的模型可以使用Qwen/Qwen3-8B这是我的邀请链接大家需要的话可以点一点硅基流动现在学生注册免费送50元额度https://cloud.siliconflow.cn/i/elkOMWfKAPI_KEY的生成方式为登录硅基流动在左边点击API密钥点击新建密钥粘贴到SILICONFLOW_API_KEY中就可以。# SiliconFlow 的 API 地址 export SILICONFLOW_BASE_URLhttps://api.siliconflow.cn/v1# 您在 SiliconFlow 平台获取的 API Keyexport SILICONFLOW_API_KEYsk-...③ 简单的RAG代码2 解决的问题① LLM的知识时效性我们通过外挂的知识库可以补充模型训练好以后的数据或者不可公开的隐私数据。② 信息的可追溯性模型回答依靠的信息是我们搜索后提供的我们可以通过提示词让模型显示出来源。③ 私有数据的利用无法公开的私有数据可以通过本地部署LLMRAG来构建知识问答系统。3存在的问题① 数据切片的策略我们存入向量库的数据是要经过分割的我们不能把一份文档整个送入而文档是有上下文依赖的粗暴的分割会把原本完整意思的话切分开导致意思改变用标点符号分割又会导致长短不一处理困难。② 数据的预处理文档是有很强的上下文信息的这些信息需要经过预处理后才能正常的使用。「例如」在一篇写小明的文章中对小明的称呼除了小明还有他这个代词在预处理的时候我们需要把他替换成小明。否则在后续的使用中我们问这篇文章一共提到过几次小明模型只能回答出称呼名字的次数。③ 检索的质量RAG系统的回答质量取决于其检索到的文档的质量而检索的策略和参数又非常多如何调出一份适合整个系统的方剂是一个很难的问题。④ LLM上下长度的限制LLM的上下文长度有限制我们要尽可能简短的为模型提供信息但当搜索匹配到大量信息时如何压缩保证不超过LLM的上下文长度限制。⑤ 如何平衡已有知识和检索到的知识权重当检索到的知识和模型训练知识冲突时我们需要决定让模型选择相信哪种要注意我们的文档不是一定正确的。Function Calling———给模型提供行动能力1定义Function Calling (函数调用) 让LLM能够调用外部的API或代码机制。这是模型与现实世界互动的“双手”。LLM 负责“决定调用哪个函数”而外部程序负责“真正执行”。系统开始前开发人员需要将要使用的函数的文档编写送入Prompt组合器中。我们需要提前编写好Prompt在里面需要告诉模型我们有哪些函数他以什么样的形式向我们传递参数。用户提问后模型通过查看函数文档以及推理思考决定调用哪个函数传递什么参数。函数服务器接受到模型的回复后按照约定解析函数参数发起函数调用。完成调用后将数据按照约定格式返回给模型。模型收到返回值后再次进行推理思考形成自然语言回答用户的问题。2Demo演示3解决的问题可以执行现实世界的动作获取实时的数据完成精确的计算4存在的问题1 依赖模型的基础能力当模型的能力较低时很难从一堆函数中选择出正确的函数并给出这个函数正确的参数格式。2复杂函数调用的挑战对于需要分解成多步骤的函数调用模型很可能陷入思维倦怠即处理到中间步骤突然停止了。3安全性和可靠性对于如删除邮件、修改信息等操作不能随意交给模型进行处理很容易误删或者误修改。4开发与调试的复杂度对于长调用链路需要追踪每一个节点的参数以及思维链三、Agent智能体拥有“自主意识”的规划者1定义如果RAG和Function Calling是“工具”那么Agent就是那个总指挥。Agent不是一个单一的技术而是一套架构的范式其核心就是利用LLM强大的推理能力来自主规划、分解任务并决定调用哪个工具。2核心逻辑ReAct范式ReAct范式模拟了人类解决问题的方式遇到问题先动脑想想Thought想好了动手去做Action做完了观察结果如何Observation根据观察的结果决定下一步怎么想怎么做也即形成一个如下图的循环。3Demo4存在的问题过长的思维链可能会陷入死循环或偏离目标交互式调用LLM成本很高并且也会导致导致延迟高排查问题困难上下文容易超限四、一个协议MCP为Agent提供标准的通信1定义MCPModel Context Protocol模型上下文协议约定了AI应用如何规范地集成外部工具实现为大模型补充上下文的目的其本质是一个应用层协议。2出现原因Function Calling 为我们提供了调用能力但没有一个统一规范的标准会导致不同人开发出来的Function 有不同的传输标准此时如果去做接入就会有大量无意义的工作产生。同时MCP还为我们提供了生成标准化函数Prompt的工作我们只需要把函数文档注释写好其就可以生成供大模型使用的提示词。MCP中主要有三个角色主机、服务端、客户端**主机端**主要负责用户与大模型的直接交互同时又负责协调外部资源进行调度。**服务端**主要负责对接外部数据或服务并通过标准的数据格式将相应的内容发送给MCP客户端。**客户端**直接寄生在MCP主机中由主机创建并进行调度客户端和服务端连接并进行数据传输。TIPSMCP时客户端与服务端的协议实际上并不涉及LLM的交互。主要解决的问题是自动进行函数文档的注入管理各个客户端的状态以及客户端和服务端的交互形式。3Demo1环境准备pip install mcp2服务端代码3客户端代码五、总结本篇文章我们从一个虽然有缺陷但推理能力超强的基本LLM出发用Prompt与之沟通用RAG作为他的外置大脑用Function Calling为其赋予行动能力并通过 Agent 架构使用 LLM 最强的推理能力来指挥这一切。我们还探讨了 MCP 协议如何为这套复杂的系统提供标准的通信规范。构建出了一个强大的工作流。但是纸上得来终觉浅只有在实战中我们才能切身体会到上面提到的问题才能想出如何优雅处理这些工具问题的方案。普通人如何抓住AI大模型的风口领取方式在文末为什么要学习大模型目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 大模型作为其中的重要组成部分 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 为各行各业带来了革命性的改变和机遇 。目前开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景其中应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过30%。随着AI大模型技术的迅速发展相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业人工智能大潮已来不加入就可能被淘汰。如果你是技术人尤其是互联网从业者现在就开始学习AI大模型技术真的是给你的人生一个重要建议最后只要你真心想学习AI大模型技术这份精心整理的学习资料我愿意无偿分享给你但是想学技术去乱搞的人别来找我在当前这个人工智能高速发展的时代AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料能够帮助更多有志于AI领域的朋友入门并深入学习。真诚无偿分享vx扫描下方二维码即可加上后会一个个给大家发大模型全套学习资料展示自我们与MoPaaS魔泊云合作以来我们不断打磨课程体系与技术内容在细节上精益求精同时在技术层面也新增了许多前沿且实用的内容力求为大家带来更系统、更实战、更落地的大模型学习体验。希望这份系统、实用的大模型学习路径能够帮助你从零入门进阶到实战真正掌握AI时代的核心技能01教学内容从零到精通完整闭环【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块内容比传统教材更贴近企业实战大量真实项目案例带你亲自上手搞数据清洗、模型调优这些硬核操作把课本知识变成真本事‌02适学人群应届毕业生‌无工作经验但想要系统学习AI大模型技术期待通过实战项目掌握核心技术。零基础转型‌非技术背景但关注AI应用场景计划通过低代码工具实现“AI行业”跨界‌。业务赋能突破瓶颈传统开发者Java/前端等学习Transformer架构与LangChain框架向AI全栈工程师转型‌。vx扫描下方二维码即可本教程比较珍贵仅限大家自行学习不要传播更严禁商用03入门到进阶学习路线图大模型学习路线图整体分为5个大的阶段04视频和书籍PDF合集从0到掌握主流大模型技术视频教程涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向新手必备的大模型学习PDF书单来了全是硬核知识帮你少走弯路不吹牛真有用05行业报告白皮书合集收集70报告与白皮书了解行业最新动态0690份面试题/经验AI大模型岗位面试经验总结谁学技术不是为了赚$呢找个好的岗位很重要07 deepseek部署包技巧大全由于篇幅有限只展示部分资料并且还在持续更新中…真诚无偿分享vx扫描下方二维码即可加上后会一个个给大家发

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询