创建企业营销网站包括哪些内容结构优化设计
2026/2/23 0:21:20 网站建设 项目流程
创建企业营销网站包括哪些内容,结构优化设计,企业软件下载,重庆网址大全什么是自查询#xff08;Self-Query#xff09;#xff1f; 自查询#xff08;Self-Query#xff09;是一种检索增强生成#xff08;RAG#xff09;技术#xff0c;它允许系统在执行向量检索之前#xff0c;先对用户的查询进行自我分析和结构化处理。简单来说#x…什么是自查询Self-Query自查询Self-Query是一种检索增强生成RAG技术它允许系统在执行向量检索之前先对用户的查询进行自我分析和结构化处理。简单来说就是让系统理解查询的语义并将其转换为更精确的检索条件。核心思想自查询将用户的自然语言查询分解为两个部分查询的语义内容用于向量相似度搜索查询的元数据过滤器用于精确过滤为什么在 RAG 中需要自查询1.提高检索精度问题场景用户查询查找2023年发布的关于人工智能的论文传统 RAG直接将整个查询转换为向量可能检索到2022年或2024年的论文检索结果不够精确自查询 RAG语义内容“关于人工智能的论文” → 向量搜索元数据过滤year 2023→ 精确过滤结果只返回2023年的AI论文2.处理结构化数据很多文档包含结构化元数据发布日期作者文档类型类别语言价格评分等自查询可以利用这些元数据进行精确过滤。3.减少无关结果示例用户查询价格低于100元的Python编程书籍自查询会提取语义内容“Python编程书籍”过滤条件price 100这样可以避免检索到高价书籍提高结果相关性。4.支持复杂查询自查询可以处理包含多个条件的复杂查询查找2023年发布、评分高于4.5、关于机器学习的英文论文分解为语义“机器学习论文”过滤器year 2023rating 4.5language English自查询的工作流程用户查询 ↓ 【查询解析器】 ↓ ├─→ 语义内容 → 向量嵌入 → 向量检索 │ └─→ 元数据过滤器 → 结构化过滤 ↓ 【结果合并】 ↓ 最终检索结果实际代码示例使用 LangChainfromlangchain.chainsimportRetrievalQAfromlangchain.retrieversimportSelfQueryRetrieverfromlangchain.llmsimportOpenAIfromlangchain.vectorstoresimportChromafromlangchain.embeddingsimportOpenAIEmbeddings# 定义文档的元数据结构metadata_field_info[{name:year,type:integer,description:文档发布的年份},{name:author,type:string,description:文档的作者},{name:category,type:string,description:文档的类别},{name:rating,type:float,description:文档的评分0-5}]# 创建自查询检索器llmOpenAI(temperature0)vectorstoreChroma(embedding_functionOpenAIEmbeddings())retrieverSelfQueryRetriever.from_llm(llm,vectorstore,document_contents技术文档和论文,metadata_field_infometadata_field_info,verboseTrue)# 使用自查询检索query查找2023年发布的关于机器学习的论文评分要高于4.0resultsretriever.get_relevant_documents(query)自查询的优势优势说明更精确结合语义搜索和结构化过滤更灵活支持复杂的查询条件更智能自动理解用户意图更高效减少无关结果的干扰更自然用户可以用自然语言表达复杂需求适用场景电商搜索按价格、品牌、评分等筛选商品文档管理按日期、作者、类型等筛选文档学术论文按年份、领域、期刊等筛选论文新闻检索按时间、来源、地区等筛选新闻代码搜索按语言、框架、版本等筛选代码总结自查询是 RAG 系统中的重要技术它通过将自然语言查询分解为语义内容和元数据过滤器显著提高了检索的准确性和相关性。特别是在处理包含结构化元数据的文档集合时自查询能够提供比纯向量搜索更精确、更符合用户预期的结果。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询