LLUMI:以線上社區反饋優化大型語言模型心理健康支援的隱私保護方案
本文提出LLUMI框架,應對大型語言模型在心理健康領域的數據隱私與標註稀缺挑戰。該框架包含生成模型(GM)和改進模型(IM),後者基於人類草稿進行優化。研究利用Reddit心理健康社區的按讚/點踩數據構建偏好對,通過監督微調和直接偏好優化對模型進行對齊,並結合可讀性、共情力、連接感、可操作性與安全性五維度的人類評估進行校準。實驗顯示,基於較小開源模型的LLUMI在語言分析與人類評估中的表現可與專有雲模型相媲美,證明了利用社區偏好信號訓練開源模型可在保障隱私的前提下提供高品質的心理健康輔助。