一种可解释的社交媒体用户的抑郁情绪风险评估方法技术

技术编号:37678914 阅读:14 留言:0更新日期:2023-05-26 04:45
本发明专利技术涉及一种可解释的社交媒体用户的抑郁情绪风险评估方法,属于负面情绪的筛查技术领域。首先建立用户数据库并将建立的用户数据库中的用户数据按照6:2:2划分为训练集、验证集和测试集,构建基于多时间尺度的原型学习网络MSTPNet;使用训练集对学习网络MSTPNet进行训练,使用验证集和测试集选择最优的模型参数,最后输入待评估用户的历史发帖数据获得待评估用户是否存在抑郁情绪。本发明专利技术的方法根据发帖时间的距离和阈值参数,基于层次聚类方法将帖子划分为不同的聚类,主要目的是确定原型的有效时段,为后续抑郁情绪表现原型持续时间等时间维度的分析提供支持。等时间维度的分析提供支持。等时间维度的分析提供支持。

【技术实现步骤摘要】
一种可解释的社交媒体用户的抑郁情绪风险评估方法


[0001]本专利技术涉及一种可解释的社交媒体用户的抑郁情绪风险评估方法,属于负面情绪的筛查


技术介绍

[0002]心理健康是健康的重要组成部分,而抑郁情绪是最普遍的负面情绪。根据世界卫生组织的报告显示,全球有超过2.64亿的人们受到抑郁情绪的困扰,且有超过100万人因为抑郁情绪而自杀。虽然有很多有效的方法可以缓解抑郁情绪,但受到困扰的人们由于羞耻等原因大多没有在第一时间寻求帮助。研究表明,抑郁情绪风险的检测和相应的主动干预是预防自杀行为和减轻经济负担的关键。
[0003]利用社交媒体数据检测具有抑郁情绪风险的用户是当前的主流方法。全球有46.2亿社交媒体用户,相当于世界人口58.4%,而且社交媒体允许用户创建和分享各种用户生成的内容,比如文本帖子和评论,这为健康分析带来了前所未有的潜力。在社交媒体中检测出潜在的抑郁情绪用户后,平台管理方可以个性化推荐一些有帮助的在线资源(例如科普文章和视频)以及提供社会支持(例如情感支持)。
[0004]社交媒体抑郁情绪风险用户检测方法的适用任务场景是利用输入的用户帖子文本数据训练出有效的抑郁情绪风险/无抑郁情绪风险二分类模型(检测模型),然后使用训练好的模型输出目标用户的分类结果,如图1所示。图中的检测模型是技术改进的对象,目的是为了提高各种检测性能,包括精准率、召回率和运算速度等。现有的社交媒体抑郁情绪风险用户检测方法主要包括基于机器学习和深度学习两类。
[0005]基于机器学习的检测模型可以学习输入特征和类别标签之间的关系。机器学习的性能主要依赖人工构建的输入特征。标准的文本输入特征包括N

grams、LIWC、LDA和POS等,领域特有的输入特征包括第一人称词汇“我”、负面情绪词汇“讨厌”“生气”“可怕”、绝对词汇“总是”“从未”“完全”等的使用频率。机器学习所使用的算法包括决策树(DT)、支持向量机(SVM)等。基于机器学习的社交媒体抑郁情绪风险用户检测方法的相关研究如表1所示。
[0006]表1基于机器学习的社交媒体抑郁情绪风险检测方法
[0007][0008]然而,基于机器学习的检测方法存在以下局限性。第一,机器学习依赖于人工构建输入特征,具有较高的劳动成本。第二,受限于领域知识,即使是专家也难以构建出全部有作用的输入特征。第三,随着时间和场景的变化,构建的特征以及训练出来的模型难以适用,应用范围较窄。
[0009]深度学习方法可以一定程度上解决上述局限,这种方法可以使用多层具有非线性激活函数、纠错和反向传播的神经网络来自动从原始数据中学习最显著且全面的特征,包括循环神经网络(RNN)、卷曲神经网络(CNN)和注意力机制等。基于深度学习的社交媒体抑郁情绪风险用户检测方法的相关研究如表2所示。
[0010]表2基于深度学习的社交媒体抑郁情绪风险检测方法
[0011][0012]基于深度学习的抑郁情绪风险检测方法通常有较高的预测性能,但是关键不足在于缺乏可解释性。深度学习模型是黑箱模型,难以解释一项输出结果背后的原因或机制,而这类模型难以适用在健康相关的高风险决策任务中。考虑注意力机制虽然能解释哪些信息更重要,但其解释能力是有限的。而的目标是提出一种既能准确检测又具有内在可解释性的社交媒体抑郁情绪风险检测方法。
[0013]大多数可解释的机器学习方法提供基于特征的解释,需要提供人工构建的特征,它们的解释揭示了每个特征对预测的贡献,这些方法可以是事后的,如SHAP和LIME,也可以是基于模型的,如生成可加性模型(GAM)、决策树模型和逻辑回归模型,这类方法的局限性在于设计有意义和有效的特征本质上具有挑战性,而且人工成本较高。例如,对于一项图像识别任务,一般只能基于像素信息构建例如亮度、RGB等特征,但更高维度的图像特征,比如边缘、形状等,难以直接定义和度量。因此,需要能够自动学习解释内容的模型。
[0014]原型学习是一种基于案例的推理形式,它通过将新输入与几个典型案例(原型)进行比较来得出结论,这种推理形式很符合日常解决问题的过程。原型学习模仿人类解决问题的过程,以获得更好的可解释性。最近,该概念已被纳入卷积神经网络和循环神经网络,以构建可解释的图像和序列数据分类器。将分别详细介绍两个前沿的基于原型学习的神经网络,这也是与本专利技术较为相近的方法。
[0015]原型学习最初被提出用于解释图像识别。例如,当人们描述为什么鸟的图片被归类为粘土色麻雀时,可能会认为鸟的头和翅膀看起来像典型的粘土色麻雀。利用这种推理机制,Chen等人设计了ProtoPNe,如图2所示。为了将鸟类图片分类为特定的鸟类物种并进
行解释,该模型引入了一个原型层。每一个原型都是为了捕捉相应鸟类物种的原型部分,或最显著和最典型的表现,例如粘土色麻雀的头部或翅膀。ProtoPNet将每个原型作为向量嵌入到潜在空间中,并定义原型相似度,通过比较原型与图像的各个部分来衡量原型在输入鸟类图片中存在的强烈程度。该模型随后根据该图像与每个原型之间计算的原型相似度的加权和对输入的鸟类图像进行分类。
[0016]原型学习也被用于解释序列分类任务,比如文本的情感识别。在这方面,Ming等人提出了ProSeNet,它在序列编码器(例如RNN)之后添加了原型层。该模型能够预测一个句子的类别(例如,积极或消极),并解释原因。图3显示了一个例子,其中输入被分类为积极的,因为它强烈地呈现了积极的原型,比如“美味的食物”和“很棒的食品服务”。
[0017]虽然尚未发现基于原型学习的社交媒体抑郁情绪风险用户检测方法,但是这两种方法确实可以应用到社交媒体抑郁情绪风险检测任务中。例如,ProtoPNet会基于用户发表的帖子信息来得知用户具有哪些典型的抑郁情绪表现(学到的原型是用户披露相关信息的典型帖子,比如诉说失眠的帖子、诉说自杀倾向的帖子),进而推断用户是否具有抑郁情绪风险。ProSeNet会基于用户发表的帖子信息来得知用户与哪些典型抑郁情绪风险用户更为相似(学到的原型是典型的抑郁情绪风险用户)并以此来推算用户是否具有抑郁情绪风险。认为,这两类方法仍存在一些不足,忽略了检测时不仅要考虑有哪些抑郁情绪表现,还要考虑这些表现的持续时间。
[0018]现有技术的缺点:
[0019]第一,以往的原型学习方法主要关注某个原型是否出现,而忽略了原型出现的频率。例如,对于三叶草和四叶草图像的分类,ProtoPNet模型关注叶子原型是否出现以及相似程度,但却忽略原型出现数量对分类结果的影响。同样,抑郁情绪风险的检测需要考虑抑郁情绪表现的类别和持续时间,而用户在社交媒体上披露多次抑郁情绪相关表现也要比只披露一次更能说明该用户具有抑郁情绪风险。
[0020]第二,以往的原型学习模型没有考虑原型的有效时间。例如,用户在某天发布了一条诉说自己失眠的帖子,但这不代表用户一直失眠,只能说明在那一天或者那一周失眠。如果不考虑抑郁情绪表现的持续时间,仅考虑某类表现是否曾经出现过,会导致错误将正常情本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种可解释的社交媒体用户的抑郁情绪风险评估方法,其特征在于该方法的步骤包括:S100:建立用户数据库并将建立的用户数据库中的用户数据按照6:2:2划分为训练集、验证集和测试集;S200:构建基于多时间尺度的原型学习网络MSTPNet;S300:使用步骤S100中的训练集对步骤S200中构建的基于多时间尺度的原型学习网络MSTPNet进行训练,使用步骤S100中的验证集和测试集选择最优的模型参数,得到分类模型;S400:输入待评估用户的历史发帖数据到步骤S300中得到的分类模型,获得待评估用户是否存在抑郁情绪风险。2.根据权利要求1所述的一种可解释的社交媒体用户的抑郁情绪风险评估方法,其特征在于:所述步骤S100中,建立的用户数据库为D={(X
(u)
,T
(u)
,y
(u)
)|u=1,2,

,|U|,其中,y
(u)
表示用户是否有抑郁情绪风险,当y
(u)
=1时代表用户有抑郁情绪风险,当y
(u)
=0时代表无抑郁情绪风险;u表示社交媒体用户样本;表示每个社交媒体用户样本所有已发布的帖子文本;|U|表示用户数量;表示帖子文本的发布日期。3.根据权利要求1或2所述的一种可解释的社交媒体用户的抑郁情绪风险评估方法,其特征在于:所述步骤S200中,构建的基于多时间尺度的原型学习网络MSTPNet包括聚类层、嵌入层、原型层、聚合层和分类层。4.根据权利要求3所述的一种可解释的社交媒体用户的抑郁情绪风险评估方法,其特征在于:所述聚类层是将邻近时间发布的帖子聚到一起,聚类大小取决于预先设定好的阈值即帖子发布时间的最大间隔。5.根据权利要求4所述的一种可解释的社交媒体用户的抑郁情绪风险评估方法,其特征在于:对于用户u=(X1,t1;X2,t2;

;X
N
,t
N
),聚类层将转换u为(C1,C2,

,C
m
):(C1,C2,

,C
m
,

,C
M
)=clustering(u)C
m
=(X
m,1
,X
m,2
,

X
m,l
,

,X
m,L
)使用的聚类方法是层次聚类法,并给予阈值h来确定聚类数量。6.根据权利要求3所述的一种可解释的社交媒体用户的抑郁情绪风险评估方法,其特征在于:所述嵌入层是将每个帖子文本转化为计算机可处理的向量表示形式,对于一个帖子X
m,l
,嵌入层将其转换为嵌入向量H
m,l
:H
m,l
=BERT(X
m,l
)。7.根据权利要求6所述的一种可解释的社交媒体用户的抑郁情绪风险评估方法,其特征在于:
所述帖子文本的编码器为BERT

base

Chinese预训练模型。8.根据权利要求3所述的一种可解释的社交媒体用户的抑郁情绪风险评估方法,其特征在于:所述原型层是学习抑郁情绪表现原型,计算用户在不同时间区间或簇中与各个原型的最高相似度,原型层包括K个待学习的嵌入向量P
k
,与帖子嵌入向量H
m,n
有相同的长度。9.根据权利要求3所述的一种可解释的社交媒体用户的抑郁情绪风险评估方法,其特征在于:所述分类...

【专利技术属性】
技术研发人员:颜志军邝俊伟谢佳亨尹秋菊
申请(专利权)人:北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1