从个体孤立到关系语境:RSPC基准重塑数字心理健康建模范式

针对自然语言处理在心理健康建模中常忽视人际背景的局限,研究提出关系压力与精神病学语料库(RSPC)。该语料库收录1,799篇由精神科医生标注的异地恋Reddit帖子,涵盖诊断类别、压力触发因素及关系阶段。通过对七种微调Transformer与五种大语言模型的基准测试,研究发现Claude-3-Haiku在障碍分类中表现最佳,GPT-4o在触发因素检测中领先。研究揭示焦虑障碍与慢性关系不确定性存在强关联,标志着心理健康建模从个体中心向社会-时间动态语境感知模式的转变,为数字亲密关系中的心理干预提供了新的技术基准与理论视角。

在当前的自然语言处理(NLP)研究中,心理健康状况的建模往往存在一个显著的局限性,即倾向于将心理疾病视为孤立的个体现象,而忽略了其背后复杂的人际互动和社会背景。这种以个体为中心的视角虽然有助于识别症状,却难以捕捉导致心理 distress 的社会诱因和动态变化。为了解决这一关键问题,本研究提出了关系压力与精神病学语料库(RSPC),旨在通过数字中介关系中的文本数据,同时捕捉心理健康困扰及其相关的关系触发因素。该研究的核心贡献在于构建了一个由精神科医生亲自标注的高质量数据集,专门聚焦于异地恋场景下的Reddit帖子。通过引入关系背景,RSPC不仅关注个体是否患有焦虑或抑郁等常见情绪障碍,还深入分析了引发这些障碍的关系压力源以及关系所处的具体阶段,从而为构建更具生态效度的心理健康NLP模型奠定了数据基础。这一举措标志着从单纯的症状识别向理解社会情境中心理健康动态的重大转变。

在技术方法层面,本研究详细描述了RSPC的构建流程及其标注体系。语料库共包含1,799篇经过筛选的Reddit帖子,这些帖子主要涉及异地恋关系中的互动与冲突。标注工作由具备专业资质的精神科医生完成,确保了诊断类别的准确性和临床相关性。标注维度包括三个主要方面:首先是诊断类别,重点识别焦虑症和抑郁症等最普遍的情绪障碍;其次是关系压力源触发因素,即具体哪些关系事件或状态导致了心理困扰;最后是关系阶段指示,用于判断帖子内容反映的关系发展时期。为了验证该语料库的有效性并探索不同模型在关系语境下的表现,研究选取了七种微调的Transformer模型和五种主流的大语言模型(LLMs)进行基准测试。测试任务被设计为三个子任务:多标签障碍分类、关系触发因素检测以及时序阶段预测。

这种多任务评估框架不仅考察了模型对心理症状的分类能力,还评估了其对复杂人际关系动态的理解能力,从而全面揭示了不同架构模型在处理社会语境信息时的技术差异和局限性。实验设置与关键结果揭示了不同模型家族在特定任务上的显著性能差异。在多标签障碍分类任务中,Claude-3-Haiku模型表现最为出色,达到了0.538的Macro-F1分数,显示出其在识别复杂心理症状组合方面的优势。而在关系触发因素检测任务中,GPT-4o模型取得了0.519的Macro-F1分数,成为该任务中的最强模型,表明其在理解细粒度社会互动线索方面具有独特能力。此外,在时序阶段预测任务中,各模型的表现也呈现出不同的特点,进一步证实了模型能力具有高度的任务依赖性。除了模型性能的对比,研究还通过数据分析发现了临床上有意义的发现,即焦虑障碍与慢性关系不确定性之间存在强关联。

这一发现不仅验证了语料库在捕捉心理-社会动态方面的有效性,也为后续研究提供了重要的实证依据。消融实验和误差分析进一步表明,当前模型在处理隐含的关系语境时仍存在不足,特别是在区分轻微压力与临床级焦虑时容易混淆,这为未来的模型优化指明了方向。RSPC基准的建立对NLP社区、心理健康领域以及工业落地具有深远的意义。首先,它为研究人员提供了一个标准化的评估平台,鼓励开发能够理解关系语境和心理动态的先进模型,推动NLP从单纯的语言理解向社会计算和临床辅助诊断方向拓展。其次,对于开源社区而言,RSPC的高质量标注数据填补了关系语境心理健康建模的空白,促进了跨学科合作,使得计算机科学家与精神科医生能够共同探索更有效的算法。在工业落地方面,这一研究为开发更智能、更具同理心的心理健康支持聊天机器人提供了技术基础,使其能够更好地识别用户背后的关系压力源,而不仅仅是表面症状。最后,RSPC支持了心理健康建模范式从个体中心向语境感知的转变,强调了社会和时间动态在心理困扰中的重要作用。未来研究可以利用这一基准进一步探索多模态数据融合、纵向关系动态建模以及个性化干预策略,从而在数字健康领域产生更广泛的社会影响。

Sources