AI旅行代理會為你預訂鬥牛嗎?前沿模型隱性動物福利基準測試
隨著AI智能體從建議者向行動者轉變,現有基於文本問答的動物福利基準測試無法評估模型在工具調用中的實際行為。本文提出TAC(旅行代理同情心)基準,首次衡量AI代理在代表用戶行動時是否避免涉及動物剝削的選項。研究構建了涵蓋六類動物剝削的十二個手寫旅行預訂場景,並通過控制價格、評分和位置混淆因素擴充至四十八個樣本。在四個實驗室七個前沿模型的評估中,所有模型得分均低於64%的隨機水平,最佳模型Claude Opus僅得53%。系統提示中加入單句福利意識語句可使Claude和GPT-5.5提升47至63個百分點,但DeepSeek和Gemini提升不足12點。審計顯示模型未察覺評估,表明低分並非因識別出測試所致。