重審語境與立場偏移:審計大模型在線上討論中的立場模擬

隨著大型語言模型被廣泛用於模擬社交媒體用戶及推斷其在網絡討論中的反應,其模擬結果是否真實反映用戶特定信念,還是僅對語境變化高度敏感,仍存巨大疑問。本研究提出「反事實語境修訂」框架用於審計基於LLM的立場模擬系統。研究首先推斷目標用戶對特定話題的初始立場,隨後通過受控策略修訂對話語境並在修訂後的語境下重新模擬用戶立場。研究對比了純文本修訂與引入模因的多模態修訂策略,重點評估平均方向性立場偏移和立場轉換率兩項核心指標。實驗結果顯示在不同極化偏好機制下兩種策略均能引發有效且穩健的立場轉換。該工作為理解LLM立場模擬的語境敏感性提供了評估框架,並深刻揭示了利用LLM模擬網絡輿論動態時所蘊含的潛力與風險。