r 昨日(11 月 15 日)發(fā)布博文,報道稱微軟研究院已更新 GraphRAG 系統(tǒng),新增了動態(tài)社區(qū)選擇(Dynamic Community Selection)功能,在改善全局搜索的數(shù)據(jù)檢索同時,tokens 成本減少了 77%。
GraphRAG 簡介
IT之家注:微軟的 GraphRAG(圖基檢索增強生成)是一種新型的檢索增強生成(RAG)框架,旨在利用知識圖譜和大型語言模型(LLMs)來提升信息處理和問答能力。
GraphRAG 通過構(gòu)建知識圖譜,從非結(jié)構(gòu)化文本中提取結(jié)構(gòu)化數(shù)據(jù),這使得模型能夠更好地理解和處理復(fù)雜信息。
自 2024 年 7 月 2 日開源以來,GraphRAG 在 GitHub 上迅速獲得了超過萬次的星標。
支持動態(tài)社區(qū)
新引入的動態(tài)社區(qū)選擇優(yōu)化了知識圖譜的訪問方式,從而提高了響應(yīng)的質(zhì)量和效率。
該過程使用輕量級模型 GPT-4o-mini 來識別相關(guān)數(shù)據(jù)部分,只有這些部分進入主要處理階段,從而顯著減少計算工作負載。內(nèi)部測試顯示,采用動態(tài)選擇后,tokens 成本平均降低了 77%。
2024 年 11 月發(fā)布的 GraphRAG 版本 0.4.0 還包括增量索引和 DRIFT(動態(tài)檢索推理與過濾技術(shù))模塊。
這些功能使得知識圖譜的更新變得更為高效,同時提高了搜索的準確性。通過這種結(jié)構(gòu),GraphRAG 能夠生成更具上下文的答案,減少了傳統(tǒng)文檔系統(tǒng)中常見的碎片化輸出。