暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

蚂蚁集团等:GraphRAG技术综述

数据库应用创新实验室 2025-04-11
14

本文为蚂蚁集团TuGraph 团队联合北京大学、浙江大学、中国人民大学、罗格斯大学共同编写的研究成果《Graph Retrieval-Augmented Generation: A Survey》论文解读,文共5942字,预计阅读需要25至30分钟。



大语言模型(LLMs)在自然语言处理领域取得显著进展,但存在缺乏领域知识、信息更新不及时和 “幻觉” 等问题。检索增强生成(RAG)通过引入外部知识改进 LLMs 输出,但传统 RAG 在处理文本关系以及全局信息提取方面有一定局限性,难以突出相互之间的影响。为此,本文提出的GraphRAG 则利用图数据库的结构信息,更精准全面地检索,提升回答的准确性和相关性。


直接使用LLM,使用RAG,使用GraphRAG的结果对比


1. 研究背景与意义


1.1研究背景


当前,如GPT-4,Qwen,LLaMA等模型的发展使得自然语言处理领域(NLP)带来无限潜力。尽管其在语言理解和文本生成方向表现出色,但是由于其缺乏特定领域的知识、实时更新信息和专有知识,LLM会出现“幻觉”现象(生成信息不正确或虚构信息)。因此,我们引入RAG(检索增强生成) 使其能够动态更新文本语料库,减少大模型出现幻觉。


在实际场景中RAG仍面临着一些限制:

1.忽视关系:在实践中,RAG只能理解文本表面意思,不能捕捉到文本之间的复杂关系。

2.冗余信息:当提示拼接时,RAG 经常以文本片段的形式重述内容。使得整体内容繁琐。

3.缺乏全局信息:RAG 只能检索到部分文档,无法全面掌握全局信息。

因此,为解决上述RAG存在的问题,图检索增强生成(GraphRAG)成为这些挑战的创新解决方案。


1.2 相关技术综述


1.2.1 RAG


RAG 结合外部知识与LLMs以提高任务性能,整合特定领域信息以确保事实性和可信度,GraphRAG 可以视为 RAG 的一个分支,它从图数据库中检索相关的关联知识。与基于文本的 RAG 相比,GraphRAG 考虑了文本之间的关系,并将结构信息作为文本之外的附加知识。


1.2.2 LLMs与图


大模型在文本理解、推理和生成方面的卓越能力,LLMs主要设计用于处理纯文本,在处理包含复杂结构信息的方面存在困难。一些论文将LLMs与 GNNs 结合,以增强对图数据的建模能力。 


1.2.3 KBQA


KBQA 是自然语言处理中的一个重要任务,旨在根据外部知识库对用户查询进行响应,基于信息检索的 KBQA 方法代表图 RAG 方法中关注下游应用的子集。本文中讨论范围扩展到 KBQA之外,包括图 RAG 在各个下游任务中的应用。


1.3 GraphRAG研究意义


GraphRAG从预先的图数据库中检索查询关系知识图谱,即考虑文本之间相互关系从而实现更为准确全面的检索关系信息,知识图谱提供文本总结能力减轻文本冗余问题,获取更为全面的信息。GraphRAG具体应用会体现在以下部分:


1.提升大语言模型性能:GraphRAG 通过引入外部结构化知识图谱,能够有效补充 LLMs 在幻觉回答方面的不足,增强其上下文理解能力。


2.改进信息检索与生成质量:相较于传统的检索增强生成(RAG),GraphRAG 能够充分利用图数据中实体间的结构关系,更精准、全面地检索相关信息。为生成高质量的回答提供更丰富、更具关联性的知识,从而提升信息检索与生成的质量 。


2. GraphRAG原理


2.1 GraphRAGg概述

GraphRAG实现框架


GraphRAG是一个利用外部结构化知识图谱来提高语言模型上下文理解并生成更明智响应的框架。GraphRAG的目标是从数据库中检索最相关的知识,从而增强下游任务的答案。


本文中,GraphRAG 的整个过程分解为三个主要阶段:

1.图索引(G-indexing): GraphRAG 的初始阶段,旨在识别或构建与下游任务相匹配的图数据库,在其上建立索引。

2.图引导检索(G-Retrieval):在基于图索引后,图引导检索阶段主要关注根据用户查询或输入从图数据库中提取相关信息。

3.图增强生成(G-Generation):图增强生成阶段涉及根据检索到的图数据合成有意义的输出或响应。这可能包括回答用户查询、生成报告等


2.2 图索引 


图数据库的构建和索引是 GraphRAG 的基础,图数据库的质量直接影响 GraphRAG 的性能。主要针对图数据的选取以及所采用的索引方法进行分类总结。

图索引流程概念图


2.2.1 图数据


在GraphRAG中,各种类型的数据根据来源被分为两大类:开放知识图谱和自构建图数据。


开放知识图谱可分为两类:百科全书类型的通用知识图谱和增强LLMs解决特定专业问题能力的领域知识图谱。


自构建库通过多个数据来源构建专属的图数据库,这将有助于特定领域的知识集成到检索过程。具体的关系图如下:

●GraphRAG

 ○通用知识图谱 

  ◆通用知识图谱

  ◆领域知识图谱

 ○自构建数据库


2.2.2 索引


基于图的索引在提高图数据库查询操作效率和速度方面发挥着关键作用,直接影响后续检索方法和粒度。常见的图索引方法如下:

●图索引:保留图整体结构,确保每个节点可以访问相邻节点,便于访问结构信息

●文本索引:将图数据转换为文本描述来优化检索过程,将知识图谱的三元组转化为自然语言。

●向量索引:将图数据转化为向量表示,增强检索效率和有效查询处理,保留完整的结构化信息。

●混合索引:根据具体场景,结合上述三种方法索引的优势实现混合索引。


2.3 图引导索引


在 GraphRAG 中,检索过程对于确保生成输出的质量和相关性至关重要,通过从外部图数据库中提取相关的高质量图数据

图检索的一般架构


2.3.1 检索器


在 GraphRAG 中,各种检索器针对检索任务的不同方面具有独特的优势。我们将检索器根据其底层模型分为三类:

●非参数检索器:非参数检索器基于启发式规则或传统图搜索算法,不依赖于深度学习模型,从而实现高检索效率。

●基于 LM 的检索器:在 GraphRAG 中,语言模型由于其强大的自然语言理解能力而成为有效的检索器。

●基于 GNN 的检索器:GNN 擅长理解和利用复杂的图结构。因此通常用来编码图数据根据与查询的相似度对不同的检索粒度进行评分。


2.3.2 检索范式


GraphRAG中,包括单次检索、迭代检索和多阶段检索在内的不同检索范式都在提高检索信息的关联性和深度方面发挥着关键作用。

●单次检索:旨在在一次操作中收集所有相关信息

●迭代检索:基于先前检索到的信息进行进一步搜索,逐步缩小到最相关的结果

●多阶段检索:将检索分为多个阶段,每个阶段可以采用不同类型的检索器进而获得精确多样化搜索结果。


2.3.3 检索粒度


根据不同的任务场景和索引类型,研究人员设计了不同的检索粒度(即从图数据中检索的相关知识的形式)每种检索粒度都有其自身优势,使其适用于不同的实际场景,具体可以分为:

●节点:节点允许对图中的单个元素进行精确检索,这对于目标查询和特定信息提取非常理想。一般来说,对于知识图谱,节点指的是实体。

●三元组:三元组通常由实体及其以主语-谓语-宾语元组形式的关系组成,为图中的关系数据提供结构化表示。

●路径:路径粒度数据的检索可以看作是捕捉实体之间关系序列,增强上下文理解和推理能力。

●子图:检索子能够捕捉图中的全面关系上下文,使 GraphRAG 能够提取和分析嵌入的复杂模式、序列和依赖关系,从而获得更细致的语义联系理解。

混合粒度:结合上述各种检索粒度优缺点提出的混合粒度模式


2.3.4 检索增强


为确保高检索质量,研究人员提出了增强用户查询和检索知识的技术。在本文中主要将查询增强分为查询扩展和查询分解,将知识增强分为合并和剪枝。

1.查询增强:应用于查询策略的预处理技术,丰富信息以获得更好的检索。

●查询扩展:通过补充或细化原始查询,丰富内容改进搜索结果

●查询分解:查询分解技术将原始用户查询分解成更小、更具体的子查,从而成功缓解了语言查询的复杂性和歧义性。

2.知识增强:检索后,知识增强策略优化并改进检索器的结果,突出显示相关信息

●知识合并:融合检索到的信,通过整合不同来源的相关细节,获得更全面的视角

●知识剪枝:过滤掉不太相关或冗余的检索信息以精炼结果


2.4 图增强生成


GraphRAG的生成阶旨在将检索到的图数据与查询相结合以提升响应质量。在此阶段,必须根据下游任务(框架开展的具体任务)选择合适的生成模型。

图语言转换示意图


2.4.1 生成器


生成器的选择取决于下游任务类型。对于判别任务一般采用图神经网络(GNN)或判别性语言模型来学习数据的表示。具体包括但不限于:图神经网络(判别预测),语言模型(推理生成)以及混合模型等。


2.4.2 图格式


使用 GNN 作为生成器时,图数据可以直接编码。然而,当利用 LM 作为生成器时,图数据的非欧几里得性导致不能直接与文本数据结合输入到 LM 中。图翻译器将图数据转换为与 LM 兼容的格式。这种转换通过使 LM 能够有效地处理和利用结构化图信息,增强了 LM 的生成能力。


2.4.3 生成增强


生成阶段,除了将检索到的图数据转换为生成器可接受的格式,为提高输出响应的质量研究人员采用各种生成增强技术。根据其应用阶段分为三类:预生成增强、中间生成增强和生成后增强。

●预生成增强:预生成增强技术侧重于在将数据或表示形式输入生成器之前提高其质量。

●中间生成增强:中间生成增强涉及在生成过程中应用的技巧,通常根据中间结果或上下文线索调整生成策略

●生成后增强:生成后增强发生在初始响应生成之后,主要涉及整合多个生成的响应以获得最终响应。


3. GraphRAG训练与结果评估


3.1 GraphRAG训练策略


GraphRAG 中检索器与生成器的训练方法。分为无训练和基于训练两类,无训练方法常用于闭源 LLMs,依赖提示控制能力,结果可能欠佳;基于训练的方法使用监督信号训练或微调模型,能提升性能。此外,联合训练两者可增强协同,提升下游任务的效果。


3.1.1 检索器训练


检索器无训练模型:目前使用中的无训练检索器主要有两种类型一种类型是非参数检索器。这些检索器依赖于预定义的规则或传统的图搜索算法,另一种类型利用预训练的 LM 作为检索器

检索器有训练模型:当检索粒度为节点或三元组时,许多方法训练检索器以最大化检索真实值与查询之间的相似度,同时区分与查询无关的事实。相反,当检索粒度为路径时,训练检索器通常采用自回归方法,将先前的关系路径连接到查询的末尾


3.1.2 生成器训练


●生成器无训练模型:无训练的生成器主要针对闭源LLMs或避免高训练成本是关键的场景将检索到的图数据与查询一起输入LLM。然后,LLMs根据提示中提供的任务描述生成响应,高度依赖其理解查询和图数据的能力。

●生成器有训练模型:训练生成器可以直接从下游任务接收监督信号。对于生成LLMs,可以使用监督微调(SFT)进行微调,将任务描述、查询和图数据输入,并将输出与下游任务的地面实况进行比较。


3.1.3 联合训练


利用它们的互补优势联合训练检索器和生成器,增强下游任务的表现。一些方法将检索器和生成器统一到一个模型中,通常为LLMs,并使用检索和生成目标同时进行训练。这种方法利用了统一架构的协同能力,使模型能够在单个框架内无缝检索相关信息并生成连贯的响应。


3.2 结果评估


我们将总结与 GraphRAG 相关的下游任务、应用领域、基准和指标以及工业应用。表中收集了现有的 GraphRAG 技术,按下游任务、基准、方法和评估指标进行分类。此表作为全面概述,突出了 GraphRAG 技术在各个领域的各个方面和应用。

GraphRAG技术评估指标


3.2.1 问题回答


QA 任务特别包括知识库问答(KBQA)和常识问答(CSQA)。KBQA 和CSQA是 GraphRAG 的关键下游任务。在 KBQA 中,问题通常涉及特定的知识图谱,答案通常涉及实体、关系或实体集合之间的关系和操作。CSQA中常识推理通常会将一个常识问题与几个答案选项一起呈现,找到与问题和选项相关的知识,并进行适当的推理。 


3.2.2 信息检索


信息检索一般分为实体链接和关系抽取:

(1) 实体链接。实体链接(EL)是自然语言处理领域的一项关键任务,涉及识别文本片段中提到的实体,并将它们链接到知识图谱中相应的实体。 

(2) 关系抽取。关系抽取(RE)旨在识别和分类文本中实体之间的语义关系。GraphRAG 可以通过使用基于图的结构来编码和利用实体之间的相互依赖关。


3.2.3 其他任务


除了上述下游任务外,GraphRAG 还可以应用于自然语言处理领域的各种其他任务,如事实核查、链接预测、对话系统和推荐。


3.3 应用领域


GraphRAG 可以将结构化知识图谱与自然语言处理相结合。因此,在电子商务和生物医学、学术、文献、法律等其他应用场景中得到广泛应用。


3.3.1 电子商务


在电子商务领域,主要目标是通过个性化推荐和智能客户服务来提升客户购物体验和增加销售额。在这个领域,用户与产品之间的历史交互可以自然地形成一个图,该图隐式地封装了用户的行为模式和偏好信息。由于电子商务平台数量不断增加以及用户交互数据的日益庞大,使用 GraphRAG 技术提取关键子图也变得至关重要。


3.3.2 生物医学


最近,GraphRAG 技术越来越多地应用于生物医学问答系统中,实现了先进的医学决策性能。在该领域每种疾病都与特定的症状相关联,每种药物都含有一定的活性成分,针对并治疗特定的疾病。有方法通常从非参数检索器开始进行初始搜索,然后设计方法通过重新排序来过滤检索。此外,一些方法提出使用检索信息重写模型输入以增强生成效。


3.3.3 学术研究与文献


在学术研究与文学领域,每篇论文都是由一位或多位研究人员撰写的,并与一个研究领域相关联。作者隶属于机构,并且存在作者之间的关系。利用 GraphRAG 在此图上可以促进学术探索,包括预测作者的潜在合作者、识别特定领域的趋势等。文学中,节点代表书籍、作者、出版商和系列,边标签为“撰写者”、“出版于”和“所属系列”。GraphRAG 可以用于增强智能图书馆等现实应用。


3.3.4 GraphRAG工业中应用


●GraphRAG(微软出品):该系统使用LLMs构建基于实体的知识图谱,并预先生成相关实体组的社区摘要,从而能够捕捉文档集合中的局部和全局关联。

●GraphRAG(星图出品):该项目是首个工业级 GraphRAG 系统,由星图数据库公司开发。项目将LLMs集成到星图数据库中,旨在提供更智能、更精确的搜索结果。

●GraphRAG(蚂蚁集团出品):该框架基于 DB-GPT、知识图谱引擎 OpenSPG 和图数据库 TuGraph 等几个 AI 工程框架开发。


3.4 基准与指标


3.4.1 基准测试


用于评估 GraphRAG 系统性能的基准测试可以分为两类一类是下游任务的对应数据集,另一类是 GraphRAG 系统专门设计的基准测试。这些基准测试通常涵盖多个任务领域,以提供全面的测试结果。


3.4.2 评估指标


GraphRAG 的评估指标可以大致分为两大类:下游任务评估(生成质量)和检索质量。

(1)下游任务评估(生成质量):在大多数研究研究中,下游任务评估指标是评估 GraphRAG 性能的主要方法。精确匹配(EM)和 F1 分数通常用于衡量回答实体的准确性.对于生成任务,如问答系统,常用的指标有 BLEU、ROUGE-L、METEOR 等,用于评估模型生成的文本质量。

(2)检索质量评估:检索系统需要在检索信息的数量和答案的覆盖率之间取得平衡。因此,一些研究利用答案覆盖率和检索子图的大小之间的比率来评估检索系统的性能。


4. 结论与未来展望


4.1 结论


本综述解读了 GraphRAG 技术,系统地分类和组织其基本原理、训练方法以及应用场景。GraphRAG 通过以图这种数据结构存储和查询数据。利用从图数据集中提取的关键关系知识,显著提高了信息检索的相关性、准确性和全面性,从而解决了传统检索增强生成方法的相关局限性。


4.2 未来展望


GraphRAG 技术取得了重大进展,但仍然面临着需要全面探索的持续挑战。GraphRAG 领域中未来研究的潜在途径如:


1.动态和自适应性:将 GraphRAG 建立在动态数据库之上,实时更新提高准确度。

2.多模态信息集成性:GraphRAG结合图像、音频和视频等其他模态信息。 

3.扩展与高效检索: 开发先进的检索算法和可扩展的基础设施用于解决GraphRAG工业中大规模的知识图谱. 

4.无损性:大量计算存在过多冗余信息,设计压缩无损技术j加速GraphRAG推理过程

5.拓展其他领域:GraphRAG在推荐系统和客服上应用广泛,急需进一步拓展专业领域内容。


图 GraphRAG 是一个相对较新的领域,存在着很多机遇同样也面临着很多困难。RAG领域缺乏比较框架,建立标准基准对于这个领域至关重要。


论文解读联系人:

刘思源

13691032906(微信同号)

liusiyuan@caict.ac.cn






数据库应用创新实验室简介




数据库是基础软件的重要一员,是支撑全球数字经济蓬勃发展的核心技术产品。为推动我国数据库产业国际地位从跟跑、并跑到领跑,多家数据库企业、应用单位、系统集成商、数据库服务企业、硬件制造商,共同成立公益性免费社群数据库应用创新实验室(以下简称“实验室”),打造了中国数据库产业的“联合舰队”。实验室持续致力于推动我国数据库产业创新发展,以实际问题为导向,以合作共赢为目标,联合政、产、学、研、用等多方力量,协同推进数据库领域应用创新的相关工作。实验室将一直秉承开放理念,持续欢迎数据库领域各企业、各机构、各组织申请加入。





实验室联系人




刘老师
13691032906
liusiyuan@caict.ac.cn

齐老师
17801071990
qidanyang@caict.ac.cn





实验室成员单位



文章转载自数据库应用创新实验室,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论