傳染網絡:多智能體LLM系統中評估者偏差的傳播機制與抑制

本研究針對大型語言模型(LLM)在多智能體系統中作為評估者時產生的系統性偏差傳播問題,提出了「傳染網絡」(Contagion Networks)這一形式化框架。透過控制變量實驗,研究量化了不同評估者偏差 profile 在交互智能體間的擴散效應。實驗發現,即使在使用相同底層模型的情況下,評估者偏差仍會在智能體間顯著傳播,跨智能體傳染矩陣係數介於 0.157 至 0.352 之間。研究進一步揭示了由譜半徑控制的三種傳播機制,並指出同構模型智能體的傳染係數遠低於異構模型,處於「抑制機制」區間。此外,將評估委員會規模從 1 人增至 3 人可有效降低 72.4% 的有效傳染率,為緩解偏差提供了切實可行的策略。該研究開源了相關實驗框架,為構建更公平的多智能體系統提供了理論依據與實踐指導。

Sources