2026/4/22 5:37:21
网站建设
项目流程
国外扁平化网站设计欣赏,哈 做网站,wordpress 变成中文,手机版制作app软件ToPG提出命题级RAG解决方案#xff0c;构建实体-命题-段落异构图#xff0c;实现三种搜索模式#xff1a;Naive(单跳事实)、Local(多跳推理)和Global(抽象/综述)。该方法通过查询感知游走#xff0c;解决了传统RAG粒度与结构不可兼得的痛点。实验证明#xff…ToPG提出命题级RAG解决方案构建实体-命题-段落异构图实现三种搜索模式Naive(单跳事实)、Local(多跳推理)和Global(抽象/综述)。该方法通过查询感知游走解决了传统RAG粒度与结构不可兼得的痛点。实验证明在复杂场景下F1提升11比GraphRAG节省30% token消耗实现了单跳、多跳和抽象问答三方面的SOTA级表现。https://github.com/idiap/ToPGhttps://arxiv.org/pdf/2601.04859A Navigational Approach for Comprehensive RAG via Traversal over Proposition Graphs一、RAG 的三座“大山”传统 RAG 方案擅长不擅长Chunk-RAG整块召回简单事实问答多跳、跨段落推理Iterative-RAG链式思考局部多跳缺乏全局视野易走偏KG-RAG三元组图谱复杂推理单跳事实精度低三元组信息压缩严重一句话痛点粒度 vs. 结构不可兼得——要么信息太粗要么结构太硬。二、ToPG 把“粒度”和“结构”同时做软2.1 核心思想图 1 一张图看懂 ToPG 框架异构图命题节点蓝色既连实体橙色也连段落绿色实现“细粒度高连通”用命题proposition作为最小知识单元把“实体-命题-段落”拼成一张异构图再让 LLM 以“建议-选择Suggestion-Selection”的方式边导航边反馈实现三种搜索模式模式场景导航策略Naive单跳事实纯向量召回命题不用图Local多跳推理迭代 Suggestion-SelectionLLM 每轮筛掉噪音Global抽象/综述多起点并行游走 → 社区检测 → 分面生成答案2.2 关键技术细节图 2 分步骤示例Local 模式如何 2 跳找到“Gloria in D 大调作曲家出生地的著名桥梁”Global 模式多起点并行游走 → 社区检测 → 综述答案模块做法公式/参数图谱构建LLM few-shot 抽取实体→命题同义词用 embedding 合并cosine ≥ 0.4Query-Aware PPR转移矩阵 M λ·结构 (1-λ)·语义相似度λ 0.5实验最佳Local 迭代每轮 LLM 判断“信息够了吗”不够就自动生成子问题继续走max-iter 3Global 社区收集 600 个锚点 → Leiden 算法分社区 → 每社区生成中间答案 → 排序合并budget 8 k 节点三、结论一张表看懂涨点单跳场景 Naive 模式已足够Local 反而增加 token 成本但在复杂场景3 轮迭代即可把 F1 拉涨 11抽象问答LLM-as-a-Judge图 3 胜率热力图600 个锚点后收益饱和维度AgricultureCSLegalComprehensiveness与 GraphRAG 持平持平略负Diversity Empowerment显著优于GraphRAG LightRAG同上同上成本视角图 4 Token 成本对比方法每抽象查询 token 消耗备注LightRAG最低关键词扩展答案深度不足ToPG-Global中等600 锚点比 GraphRAG 省 30% 生成 tokenGraphRAG最高预生成社区摘要输入膨胀四、一句话总结ToPG 用“命题级粒度查询感知游走”证明把图谱做软、把导航做活就能在单跳、多跳、抽象问答三条赛道都拿到 SOTA 级成绩。如何学习AI大模型我在一线互联网企业工作十余年里指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限很多互联网行业朋友无法获得正确的资料得到学习提升故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。这份完整版的大模型 AI 学习和面试资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】第一阶段从大模型系统设计入手讲解大模型的主要方法第二阶段在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用第三阶段大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统第四阶段大模型知识库应用开发以LangChain框架为例构建物流行业咨询智能问答系统第五阶段大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型第六阶段以SD多模态大模型为主搭建了文生图小程序案例第七阶段以大模型平台应用与开发为主通过星火大模型文心大模型等成熟大模型构建大模型行业应用。学会后的收获• 基于大模型全栈工程实现前端、后端、产品经理、设计、数据分析等通过这门课可获得不同能力• 能够利用大模型解决相关实际项目需求 大数据时代越来越多的企业和机构需要处理海量数据利用大模型技术可以更好地处理这些数据提高数据分析和决策的准确性。因此掌握大模型应用开发技能可以让程序员更好地应对实际项目需求• 基于大模型和企业数据AI应用开发实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能 学会Fine-tuning垂直训练大模型数据准备、数据蒸馏、大模型部署一站式掌握• 能够完成时下热门大模型垂直领域模型训练能力提高程序员的编码能力 大模型应用开发需要掌握机器学习算法、深度学习框架等技术这些技术的掌握可以提高程序员的编码能力和分析能力让程序员更加熟练地编写高质量的代码。1.AI大模型学习路线图2.100套AI大模型商业化落地方案3.100集大模型视频教程4.200本大模型PDF书籍5.LLM面试题合集6.AI产品经理资源合集获取方式有需要的小伙伴可以保存图片到wx扫描二v码免费领取【保证100%免费】