EdgeQuake:用Rust打造的高性能GraphRAG框架,讓知識圖譜驅動下一代檢索
EdgeQuake是一個用Rust實現的高性能GraphRAG框架,基於LightRAG算法,將文檔不僅切片和向量化,更分解爲實體與關係構成的知識圖譜。傳統RAG系統僅依賴向量相似度檢索,面對多跳推理("X如何通過Z影響Y")和關係查詢時力不從心。EdgeQuake在查詢時同時遍歷向量空間和圖結構,結合向量搜索的速度與圖遍歷的推理能力。支持6種查詢模式、PDF視覺流水線(GPT-4o/Claude/Gemini直接讀取PDF頁面圖像)、OpenAPI REST接口、SSE流式傳輸和多租戶隔離。基於Tokio異步架構,可處理數千併發請求,配備React 19前端和Sigma.js交互式圖譜可視化。
傳統RAG的瓶頸
傳統RAG(檢索增強生成)系統將文檔切片後做向量嵌入,查詢時通過向量相似度找到最相關的片段。這種方式在簡單問答中表現不錯,但遇到以下場景就力不從心:
- **多跳推理**:"A供應商的變化如何通過B環節影響了C產品的利潤?"
- **主題歸納**:"這批文檔的主要主題是什麼?"
- **關係查詢**:"哪些實體之間存在間接關聯?"
根本原因:向量捕捉了語義相似性,卻丟失了概念之間的結構關係。
GraphRAG的解決方案
EdgeQuake基於LightRAG算法,在傳統RAG流程上增加了知識圖譜層:
| 步驟 | 傳統RAG | EdgeQuake GraphRAG |
|------|---------|-------------------|
| 文檔處理 | 切片 → 向量嵌入 | 切片 → 實體抽取 → 關係映射 → 知識圖譜 |
| 查詢方式 | 向量相似度匹配 | 向量搜索 + 圖遍歷雙引擎 |
| 推理能力 | 單跳檢索 | 多跳推理,關係鏈追蹤 |
| PDF處理 | 文字提取 | LLM視覺管線(GPT-4o/Claude直接讀圖像) |
6種查詢模式覆蓋不同需求:從快速的樸素向量搜索到圖遍歷混合查詢,按場景選擇最優策略。
工程實現亮點
Rust + Tokio異步架構帶來極致性能,零拷貝操作處理數千併發請求。v0.4.0新增的PDF視覺流水線讓多模態LLM直接以圖像方式讀取PDF頁面,解決了掃描件、複雜表格和多欄排版的難題。生產級特性包括OpenAPI 3.0接口、SSE流式傳輸和多租戶工作空間隔離。
行業趨勢關聯
EdgeQuake代表了RAG技術從"檢索"到"推理"的進化方向。隨着Agentic AI系統需要處理越來越複雜的知識密集型任務,單純的向量檢索已不足以支撐Agent的決策需求。GraphRAG與Open Source AI生態的結合,正在爲下一代AI Coding和企業知識管理奠定基礎。