Contagion Networks:揭示多智能体系统中评估者偏差的隐秘传播链

最新研究提出Contagion Networks框架,深入量化大型语言模型作为评估者时,其系统性评估偏差在多智能体网络中的传播规律。通过基于DeepSeek-chat的受控实验,研究构建了跨智能体传播矩阵,证实即便在同构模型内部,评估偏差仍能持续扩散,传播系数介于0.157至0.352之间。研究识别出由谱半径主导的三种传播机制,并发现同质模型智能体的传播系数仅为跨模型场景的三分之一至五分之一。此外,将评估委员会规模从单一节点扩展至三人小组,可有效降低72.4%的有效偏差传播,为提升多智能体系统评估的可靠性提供了极具操作性的缓解策略,相关框架已开源。

在多智能体系统中,当大型语言模型被赋予评估者角色时,其内在的系统性评估偏差并非孤立存在,而是会在智能体间的交互中发生显著传播,这一现象严重影响了系统输出的公正性与可靠性。针对这一关键问题,本研究提出了 Contagion Networks 形式化框架,旨在精确测量并解析评估者偏差如何在相互作用的 LLM 智能体网络中扩散。该研究的核心贡献在于首次建立了量化评估偏差传播的数学模型,并通过严格的受控实验揭示了偏差传播的动态规律。研究不仅证明了偏差传播的普遍性,还深入分析了不同模型配置对传播强度的影响,为理解多智能体系统中的信息污染机制提供了理论基础。

通过引入跨智能体传播矩阵,研究能够直观展示偏差在节点间的流动路径与强度,从而为后续的开发者提供可视化的分析工具,帮助识别系统中的脆弱环节并优化评估流程,确保多智能体协作的稳健性。在技术方法层面,研究设计了一个包含三个智能体的受控实验环境,所有智能体均基于 DeepSeek-chat 模型构建,但被赋予了三种截然不同的评估者偏差画像:结构化偏差、平衡偏差以及基于证据的偏差。这种设计使得研究者能够在控制变量为同一底层模型的前提下,单独考察偏差画像对传播行为的影响。研究构建了跨智能体传播矩阵 Gamma_3,通过计算矩阵的特征值与谱半径 rho(Gamma_N),识别出三种不同的传播机制:抑制、临界与爆发。

实验详细记录了在不同偏差画像组合下,评估结果如何从一个智能体传递并扭曲另一个智能体的判断。此外,研究还对比了同质模型智能体与跨模型智能体在传播系数上的差异,发现同质模型间的传播系数显著低于跨模型场景,这表明模型架构的相似性可能在一定程度上起到缓冲作用。训练策略上,研究侧重于静态偏差注入与动态交互观测,而非传统的模型微调,从而更纯粹地观察偏差传播的自然动力学过程。实验设置基于精心设计的三智能体交互协议,关键结果揭示了偏差传播的量化特征。

数据显示,评估者偏差在智能体间持续传播,传播系数 gamma 稳定在 0.157 至 0.352 的区间内。这一发现证实了即便在没有外部干扰的情况下,模型内部的偏差也会通过交互被放大或转移。消融实验进一步表明,同质模型智能体产生的传播系数比先前工作中观察到的跨模型系数(如 MM-EPC 中的 0.85-1.3)弱 3 到 5 倍,这将其归类于传播抑制机制中。更为重要的是,研究探索了缓解策略的有效性,发现将评估委员会的规模从单个评估者(k=1)增加到三个评估者(k=3)时,有效传播率大幅降低了 72.4%。

这一关键指标证明了集体决策机制在过滤个体偏差方面的巨大潜力,为多智能体评估架构的设计提供了强有力的数据支持,表明增加评估节点的多样性与数量是抑制偏差传播的有效手段。从行业意义与潜在影响来看,Contagion Networks 框架的提出对开源社区与工业落地具有深远影响。随着多智能体系统在自动化代码审查、内容审核及复杂决策支持中的广泛应用,评估偏差的传播可能导致系统性错误的大规模扩散,进而引发严重的信任危机。本研究开源的实验框架为开发者提供了一个标准化的工具,用于在部署前检测和优化多智能体评估流程中的偏差风险。对于工业界而言,研究结果建议在设计高可靠性多智能体系统时,应优先考虑引入多评估者委员会机制,并监控智能体间的偏差传播谱半径,以确保系统的鲁棒性。此外,该研究为后续关于多智能体对齐、公平性及安全性的研究开辟了新的方向,鼓励学术界进一步探索如何在保持模型智能的同时,最小化其社会性偏差的负面影响,推动人工智能系统向更公正、透明的方向发展。

Sources