Graph Retrieval-Augmented Generation: A Survey

from GraphRAG Graph Retrieval-Augmented Generation: A Survey https://arxiv.org/abs/2408.08921 RAGの弱点（関係性を無視、冗長コンテキスト、全体像の欠落）を、グラフ構造（KG/TAG）の活用で補い、より正確・文脈理解の深い生成を実現するための技術体系を整理した総説。

何が新しいか

GraphRAGの定式化：
1. G-Indexing（グラフ構築・索引化）
2. G-Retrieval（ノード/トリプル/パス/サブグラフの取得）
3. G-Generation（取得グラフを入力に生成）
文字列RAGでは拾いにくい関係知識・グローバル構造を活用し、QFSなどでも有利。

G-Indexing（グラフ基盤）

データ源：オープンKG（Wikidata/ConceptNet等）／自前構築（文書・表・ログからのTAG化）。
- TAGとは
  - Text-Attributed Graphs
  - NGはKnowledge Graphのこと
    - 従来Knowledge Graphと呼ばれていたものから一段階抽象化したということ
索引：
- グラフ索引（構造探索）
- テキスト索引（テンプレ変換→BM25/密検索）
- ベクトル索引（ノード/エゴネット埋め込み）
- ハイブリッド推奨。

G-Retrieval（取得）

G-Generation（生成）

生成器：
- GNN（判別タスクに強い）
- LM（生成/推論に強い）
- ハイブリッド：カスケード（GNN→LM前置き）／並列（表現結合・出力統合）。
グラフのLM入力形式：
- グラフ言語（エッジ表、自然文、コード風表記、構文木、ノード列）
- グラフ埋め込み（Prefix/Prompt TuningやFiDで融合）。
生成強化：事前（書き換え・計画）／途中（制約デコード等）／事後（回答統合・検証）。

学習

適用・評価

産業事例

Microsoft GraphRAG（コミュニティ要約でQFS強化）、NebulaGraph版、Ant Group版、Neo4j NaLLM/Graph Builder など。

今後の論点

実務のヒント（超要約）

(C)NISHIO Hirokazu / Converted from Markdown (ja)
Source: [GitHub] / [Scrapbox]