2026/3/10 3:33:46
网站建设
项目流程
深圳网站网络推广公司,手机建站平台哪个便宜,栾城区城乡建设局网站,手机制作网站的软件有哪些东西当企业知识沉睡于数据孤岛#xff0c;大模型却在幻觉中徘徊。RAG不只是技术#xff0c;更是打通知识与智能的关键桥梁。
本文分享企业级RAG系统实践经验#xff0c;从三个方面展开#xff1a;实践流程架构及特点、理论依据、实践总结与展望。通过从Naive RAG到Agentic RAG…当企业知识沉睡于数据孤岛大模型却在幻觉中徘徊。RAG不只是技术更是打通知识与智能的关键桥梁。本文分享企业级RAG系统实践经验从三个方面展开实践流程架构及特点、理论依据、实践总结与展望。通过从Naive RAG到Agentic RAG的演进路径探索如何构建真正赋能企业的知识型AI应用。RAG实践流程架构数据工程文档加载数据是RAG系统的基础高质量的数据加载流程至关重要多源数据支持企业数据分散在不同格式中需支持TXT、MD、PPT、PDF、Word、Excel、图片、网页等多种格式数据清洗策略结构化清洗表格数据规范化、列名标准化非结构化清洗去除特殊字符、HTML标签、冗余信息语言标准化统一编码、处理多语言文档元数据提取自动提取文档创建时间、作者、版本等关键元数据便于后续检索和溯源增量更新机制建立文档变更检测机制只处理变更部分提高系统效率文档分块分块质量直接影响检索精度和生成质量字符分块按固定字符数量切分简单但可能破坏语义完整性段落分块按自然段落切分保持基本语义单元语义分块基于语义边界智能切分保证每个块的语义完整性智能分块递归分块大块先分再细分滑动窗口保证上下文连贯性重叠分块相邻块保留一定重叠避免信息丢失分块粒度自适应根据文档类型和内容复杂度动态调整分块大小文档嵌入嵌入模型选型通用嵌入模型BGE-M3多语言支持强中文表现优异text-embedding-3-smallOpenAI小型嵌入模型性能与成本平衡text-embedding-3-large高精度需求场景GTE-large开源模型中表现优异E5-large-v2微软开源模型英文表现突出模型选择考量因素语言支持中英文或多语言需求维度大小低维(384)到高维(1536)权衡推理速度生产环境吞吐量要求部署成本云服务或本地部署成本嵌入方式及算法密集嵌入(Dense Embedding)优势捕捉语义相似性处理同义词代表Transformer类模型生成的向量稀疏嵌入(Sparse Embedding)优势精确匹配关键词处理专业术语算法TF-IDF、BM25混合嵌入(Hybrid Embedding)密集稀疏结合兼顾语义和关键词匹配实现方式ColBERT、SPLADE等专用领域嵌入模型微调领域适应微调对比学习构建领域内正负样本对蒸馏学习从大模型蒸馏领域知识微调数据构建领域问答对构建专业领域QA对相似度标注人工标注文档相似度评估指标检索准确率Pk, Rk, MRR相似度一致性与人工判断的一致性文档索引建立父子文档索引节点-句子窗口递归索引器构建文档层次结构从章节到段落到句子优势保留文档结构信息支持多粒度检索实现存储父子关系检索时可回溯上下文分层索引层次节点解析器(RAPTOR)按语义层次构建索引树检索时先定位大块再精确定位小块优势提高检索效率降低计算成本多表示索引多视角表示同一文档使用不同嵌入模型表示不同粒度的文档块并行索引优势提高检索鲁棒性应对多样化查询向量数据库数据库选型开源自部署选项Milvus分布式架构高吞吐量企业级支持Weaviate模块化设计支持多模态QdrantRust实现性能优异过滤功能强大Chroma轻量级Python原生支持快速原型FAISSMeta开源专注高性能向量检索云服务选项Pinecone全托管零运维按需扩展ElasticSearch/OpenSearch成熟生态全文检索向量能力选型考量因素数据规模百万级、亿级、百亿级查询QPS高并发需求元数据过滤结构化数据过滤能力运维成本自建vs云服务集成难度与现有系统兼容性索引算法选型精确检索FLAT暴力计算精确但计算量大近似检索IVF倒排索引空间分区HNSW层次化小世界图高效近似检索LSH局部敏感哈希适合超大规模数据量化算法SQ标量量化简单压缩PQ/OPQ乘积量化/优化乘积量化大幅降低存储选型考量精度vs速度召回率与查询时间权衡内存消耗有限资源环境考量构建时间索引创建和更新效率检索前处理查询构建text2sql将自然语言转换为SQL查询关系型数据库实现基于LLM的SQL生成结合模板和约束text2cypher将自然语言转换为Cypher查询图数据库应用知识图谱查询关系推理自查询检索器自动构建向量数据库过滤条件元数据过滤时间范围、文档类型、部门等混合查询向量相似度结构化条件查询优化查询重写多查询生成一个问题生成多个变体查询退一步查询简化复杂查询提高召回率RAG-Fusion多查询结果融合排序查询分解复杂问题拆分为多个简单子问题子问题独立检索后结果合并查询澄清模糊问题生成澄清性子问题交互式引导用户明确意图查询扩展HyDE(Hypothetical Document Embeddings)先用LLM生成假设性文档对假设文档而非原始查询进行编码提高复杂问题的检索效果查询路由逻辑路由基于问题类型选择合适数据源实现规则引擎或LLM判断语义路由动态选择最佳嵌入模型和索引方式根据问题特征选择检索策略工具调用判断是否需要调用外部工具工具选择计算器、API调用、代码执行器等检索后处理重排基础重排算法RRF(Reciprocal Rank Fusion)多源检索结果融合CrossEncoder对查询,文档对重新评分高级重排方法ColBEAR细粒度token级别相关性计算RankerGPT/RankLLM利用大模型进行相关性判断融合策略RAG-Fusion多查询结果的排序融合加权融合不同来源结果的权重分配压缩相关性压缩保留高相关段落删除低相关内容基于相似度阈值过滤冗余度压缩检测并合并语义重复内容实现聚类或相似度矩阵计算上下文优化智能截取关键上下文保持信息密度最大化CRAG(Corrective RAG)主动检索校正初步检索结果评估不满足时触发再次检索多源检索内部知识库检索失败时转向外部数据源(如网络)检索反馈循环基于检索结果质量调整策略动态优化检索参数内容生成提示词工程结构化提示模板角色定义明确LLM应扮演的角色任务说明清晰定义输出要求格式约束指定输出格式上下文增强检索结果组织重要信息优先引用标记便于溯源指令分离区分检索内容和生成指令思维链(CoT)引导模型逐步推理提高复杂问题解答质量LLM选型商业模型GPT-4/GPT-4o综合能力强成本较高Claude 3.5 Sonnet推理能力出色长文本处理优异GPT-3.5-Turbo性价比高适合一般场景开源模型DeepSeek中英双语能力强Qwen2阿里开源中文优势明显Llama 3Meta开源社区支持广泛Mistral小参数量高性能选型考量因素语言能力中文/英文/多语言推理能力逻辑性、一致性部署环境云API/本地部署成本控制API调用成本/硬件投入上下文窗口8K/16K/32K/128K输出解析文本格式化结构化段落重点突出逻辑组织JSON输出结构化数据返回便于前端渲染和处理格式校验和纠正Markdown渲染富文本展示表格、列表等高级格式代码块语法高亮工具调用Function/Tool Calls模型判断并调用外部函数数据查询、计算、API调用等MCP(Multi-modal Conversational Prompting)多模态交互图表生成、数据可视化专用领域生成模型微调指令微调构建领域指令数据集LoRA/QLoRA低参数微调RAG增强微调结合检索结果进行微调提高领域知识准确性RLHF/DPO基于人类反馈的强化学习直接偏好优化主动生成Self-RAG模型自评估生成内容质量不满足时触发重新检索RRR(Retrieve, Rerank, Rewrite)检索、重排、重写三步流程迭代优化生成质量评估检索评估精确率(Precision)检索结果中相关文档的比例Pk前k个结果中的精确率召回率(Recall)相关文档被成功检索的比例衡量检索系统的覆盖能力F1分数精确率和召回率的调和平均综合评估检索效果MRR(Mean Reciprocal Rank)首个相关结果排名的倒数平均评估排序质量生成评估自动评估指标BLEU/ROUGE基于n-gram的文本相似度METEOR考虑同义词的评估指标BERTScore基于语义的评估安全性评估幻觉检测验证生成内容与事实一致性有害内容过滤确保输出符合安全标准人工评估专家评审领域专家质量评估A/B测试不同系统对比测试业务指标用户满意度NPS/CSAT解决率问题一次性解决比例效率提升与传统方式对比的时间节省实践流程理论依据Navie RAG架构流程1、索引构建(离线)数据加载从各个来源整合数据。文档切块按照一定策略切块文档如固定大小语义分块等。向量化与存储使用Embedding模型bge系列等将文档转换成向量将向量即文档信息存储到向量数据库腾讯云MilvusFaiss等。2、在线检索在线检索使用相同Embedding模型转换用户输入并从向量数据库检索相似TopK文档余弦相似度或者欧氏距离。生成将用户输入与检索到的toK文档组织成Prompt输入LLM生成回答。Advanced RAG架构流程基于Navie Rag增加两个步骤包含5个阶段Indexing - Pre Retrieval - Retrievel - Post Retrievel - Generation旨在解决文档召回的质量和准确率。Navie RAG属于Advanced Rag的一个特化即Pre Retrievel和Post Retrievel为空。1、Pre-Retrieval预检索处理: 侧重数据索引优化。索引数据优化**增强数据密度**如利用LLM清洗冗余信息元数据增强条件过滤等。**增强索引语义:**如预生成chunk快的假设性问题提升检索对称性建立如关键词搜索BM25向量检索或图数据库。尝试多种chunk分块策略固定大小递归语义分块。**Embeddings模型优化:**针对特定领域数据对模型进行微调提升语义匹配精度。Query增强**Query translation:**query转换用于用户的不确定性用户可能会输入模糊表达或query与index文档不在一个语义空间或query过于复杂的情况因此需要query转换。如query-rewrite,query-expansion等。**Query enhancement:**query增强增强或者扩大用户输入的query语义如: HyDE(假设文档增强)Step-Back Prompting(回退一步prompt)。**Query decomposition:**query分解把用户的复杂query分解成多个可管理的子问题引导模型逐步解决各个子问题。如Answer Recursively递归回答迭代Answer Individually独立回答分解后并行回答。2、Post-Retrievel后检索处理: 侧重数据结果的二次加工过滤重排序Rerank对检索出的文档做更精细的评估将真正最匹配意图的文档排列到前面尽可能减少噪声上下文压缩Prompt Compression若检索出大量文档在输送给LLM之前可能还需要对文档做裁切仅保留最关键核心的内容Modular RAG ☆核心依据架构流程模块化RAG将 RAG 系统分为Module Type、Module和Operators三层结构。每个 Module Type 代表 RAG 系统中的一个核心流程包含多个功能模块。通过整个 RAG 系统变成了多个模块和序列排列组合形成 RAG 工作流。整体有7个部分Indexing, Pre Retrieval, Retrievel, Post Retrievel, Memory, Generation,Orchestration. 这种范式在基于Advanced RAG的横向架构上引入了纵向的结构即Module和Operators。Agentic RAG架构Single-Agent Agentic RAG该框架核心是一个系统决策中心的Router Agent该Agent动态处理信息检索集成操作比较适用于多检索源的简单问答场景。Multi-Agent Agentic RAG为Single-Agent Agentic RAG架构的演进版本用多个专用代理来细化更复杂的工作流和不同的查询类型。核心Router Agent下又挂接了多个检索Agent, 如Agent1用于查询结构化数据(Mysql)Agent2用于查询非结构化数据Agent3用于Web查询或专用API查询等。Hierarchical Agentic RAG分层代理RAG为Multi-Agent Agentic RAG架构的拓展将整个系统分为多个层级的Agent由顶级Agent驱动子Agent并聚合子Agent的结果。Agentic Corrective RAGCorrective RAG的核心是他可以动态评估检索到的文档并纠正查询提升检索文档的质量。Agentic Corrective RAG系统建立在5个关键Agent上。Context Retrieval Agent:负责从数据库中检索相关上下文。**Relevance Evaluation Agent:**负责评估检索到的文档的相关性并标记出不相关或不明确文档并采取纠正措施。**Query Refinement Agent:**重写query增强检索的Agent。**External Knowledge Retrieval Agent:**当Context Retrieval Agent检索的上下文不足时从其他备用数据源检索数据(如Web 检索)。**Response Synthesis Agent:**组织响应Agent。Adaptive Agentic RAG自适应Agent RAG, 与上述Modular RAG中的Adaptive retrieval一样语义上都是在各个环节引入了LLM判断并在引入LLM评测实现Loop自迭代。Graph-Based Agentic RAGGraph-Based Agentic RAG在检索中引入了图检索合并图数据及其他检索数据增强检索效果。流程思想**Agentic RAG**架构上引入Agent的思路实现动态决策如是否检索、工具调用和多轮迭代优化。相比上述提到的几种RAGAgentic RAG将实际输入处理的多样性交给LLM处理可以解决更复杂的问题。Agent的核心部件LLM Memory Planning Tools总结企业级RAG系统的落地是一个复杂的系统工程需要从简单到复杂、从单一到模块化、从静态到动态的演进过程。通过本文提供的实践框架我们可以看到RAG技术已经从最初的Naive RAG发展到更加复杂的Modular RAG和Agentic RAG架构。RAG技术演进路径从Naive RAG到Advanced RAG通过增加Pre-Retrieval和Post-Retrieval环节解决了简单RAG在文档召回质量和准确率方面的局限性。从Advanced RAG到Modular RAG将RAG系统模块化为多个功能组件形成灵活的工作流使系统更具可扩展性和适应性。Modular RAG将系统分为Module Type、Module和Operators三层结构每个核心流程都可以包含多个功能模块通过组合形成完整的RAG工作流。从Modular RAG到Agentic RAG引入智能Agent作为决策中心实现动态处理信息检索和集成操作进一步提升系统的智能性和自适应能力。企业实践的关键思考模块化思维企业在实施RAG系统时应采用模块化设计思想将复杂系统拆分为可独立优化的功能模块便于迭代和扩展。自适应机制引入LLM作为决策中心实现系统的自适应能力能够根据不同查询类型和内容动态调整检索策略和生成策略。多源融合能力现代企业数据分散在多个系统中RAG系统需要具备多源数据融合能力包括结构化数据库、非结构化文档、知识图谱等。闭环优化建立评估-反馈-优化的闭环机制通过持续监控系统性能不断优化各个环节的效果。Agent协作框架对于复杂业务场景可考虑采用多Agent协作框架如Hierarchical Agentic RAG或Multi-Agent Agentic RAG将不同职责分配给专门的Agent处理。未来发展方向随着大模型和向量检索技术的不断进步企业级RAG系统将向以下方向发展更深度的业务集成RAG系统将与企业核心业务流程深度集成成为员工和客户交互的智能中枢。多模态RAG扩展到图像、音频、视频等多模态内容的检索和生成提供更全面的知识服务。自学习能力系统能够从用户交互中学习自动优化检索策略和生成质量减少人工干预。知识推理增强结合知识图谱和推理能力不仅检索已有知识还能进行知识推理和创新。分布式协作多个专业领域RAG系统协同工作共同解决跨领域复杂问题。企业级RAG系统的成功落地不仅需要先进的技术架构还需要与企业业务深度结合持续迭代优化最终实现AI与人类专家知识的完美融合创造真正的商业价值。通过从Naive RAG到Agentic RAG的演进企业可以构建出更加智能、高效、准确的知识服务系统为数字化转型提供强大支撑。大模型算是目前当之无愧最火的一个方向了算是新时代的风口有小伙伴觉得作为新领域、新方向人才需求必然相当大与之相应的人才缺乏、人才竞争自然也会更少那转行去做大模型是不是一个更好的选择呢是不是更好就业呢是不是就暂时能抵抗35岁中年危机呢答案当然是这样大模型必然是新风口那如何学习大模型 由于新岗位的生产效率要优于被取代岗位的生产效率所以实际上整个社会的生产效率是提升的。但是具体到个人只能说是最先掌握AI的人将会比较晚掌握AI的人有竞争优势。这句话放在计算机、互联网、移动互联网的开局时期都是一样的道理。但现在很多想入行大模型的人苦于现在网上的大模型老课程老教材学也不是不学也不是基于此我用做产品的心态来打磨这份大模型教程深挖痛点并持续修改了近100余次后终于把整个AI大模型的学习路线完善出来在这个版本当中您只需要听我讲跟着我做即可为了让学习的道路变得更简单这份大模型路线学习教程已经给大家整理并打包分享出来, 有需要的小伙伴可以扫描下方二维码领取↓↓↓CSDN大礼包全网最全《LLM大模型学习资源包》免费分享安全咨料放心领取一、大模型经典书籍免费分享AI大模型已经成为了当今科技领域的一大热点那以下这些大模型书籍就是非常不错的学习资源。二、640套大模型报告免费分享这套包含640份报告的合集涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师还是对AI大模型感兴趣的爱好者这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)三、大模型系列视频教程免费分享四、2025最新大模型学习路线免费分享我们把学习路线分成L1到L4四个阶段一步步带你从入门到进阶从理论到实战。L1阶段:启航篇丨极速破界AI新时代L1阶段了解大模型的基础知识以及大模型在各个行业的应用和分析学习理解大模型的核心原理、关键技术以及大模型应用场景。L2阶段攻坚篇丨RAG开发实战工坊L2阶段AI大模型RAG应用开发工程主要学习RAG检索增强生成包括Naive RAG、Advanced-RAG以及RAG性能评估还有GraphRAG在内的多个RAG热门项目的分析。L3阶段跃迁篇丨Agent智能体架构设计L3阶段大模型Agent应用架构进阶实现主要学习LangChain、 LIamaIndex框架也会学习到AutoGPT、 MetaGPT等多Agent系统打造Agent智能体。L4阶段精进篇丨模型微调与私有化部署L4阶段大模型的微调和私有化部署更加深入的探讨Transformer架构学习大模型的微调技术利用DeepSpeed、Lamam Factory等工具快速进行模型微调并通过Ollama、vLLM等推理部署框架实现模型的快速部署。L5阶段专题集丨特训篇 【录播课】全套的AI大模型学习资源已经整理打包有需要的小伙伴可以微信扫描下方二维码免费领取CSDN大礼包全网最全《LLM大模型学习资源包》免费分享安全资料放心领取