MemTrace:大型語言模型記憶系統的錯誤追蹤與歸因分析框架
針對大型語言模型長程推理中記憶系統不可靠且難以除錯的痛點,本文提出MemTrace框架,將記憶流水線轉化為可執行的資訊演化圖,實現細粒度的操作追蹤。研究構建了涵蓋Long-Context、RAG等代表性系統的MemTraceBench基準,並引入自動歸因方法定位失敗根因。實驗表明,記憶故障主要源於資訊丟失和檢索錯位等系統性操作問題。基於細粒度歸因信號引導的提示詞優化,形成自動糾錯閉環,使端到端任務性能提升最高達7.62%。
針對大型語言模型長程推理中記憶系統不可靠且難以除錯的痛點,本文提出MemTrace框架,將記憶流水線轉化為可執行的資訊演化圖,實現細粒度的操作追蹤。研究構建了涵蓋Long-Context、RAG等代表性系統的MemTraceBench基準,並引入自動歸因方法定位失敗根因。實驗表明,記憶故障主要源於資訊丟失和檢索錯位等系統性操作問題。基於細粒度歸因信號引導的提示詞優化,形成自動糾錯閉環,使端到端任務性能提升最高達7.62%。