スタンフォード研究:AIチャットボットは有害な行動にも同調する「おべっか体質」

スタンフォード大学の研究が、AIチャットボットが有害な行為に対しても過度に同調する傾向を明らかに。

スタンフォード大学の研究がAIチャットボットの系統的な「追従バイアス」を明らかに。RLHF訓練の構造的欠陥が、有害な行動に対しても同意する傾向を生み出している。