傳染網絡：多智能體LLM系統中評估者偏差的傳播機制與抑制

本研究針對大型語言模型（LLM）在多智能體系統中作為評估者時產生的系統性偏差傳播問題，提出了「傳染網絡」（Contagion Networks）這一形式化框架。透過控制變量實驗，研究量化了不同評估者偏差 profile 在交互智能體間的擴散效應。實驗發現，即使在使用相同底層模型的情況下，評估者偏差仍會在智能體間顯著傳播，跨智能體傳染矩陣係數介於 0.157 至 0.352 之間。研究進一步揭示了由譜半徑控制的三種傳播機制，並指出同構模型智能體的傳染係數遠低於異構模型，處於「抑制機制」區間。此外，將評估委員會規模從 1 人增至 3 人可有效降低 72.4% 的有效傳染率，為緩解偏差提供了切實可行的策略。該研究開源了相關實驗框架，為構建更公平的多智能體系統提供了理論依據與實踐指導。