一种基于软提示主题建模的抑郁情绪检测方法及系统技术方案

技术编号:39304513 阅读:10 留言:0更新日期:2023-11-12 15:53
本发明专利技术公开了一种基于软提示主题建模的抑郁情绪检测方法及系统,属于情绪检测技术领域,包括:第一步,将每个样本的对话转录文本按照预定义的k个主题分割成若干个小片段。第二步,首先修改BERT模型的Embedding层,当文本片段转换为的Token输入BERT时,在其前部添加上固定长度的软提示Token。连接后的Token经过BERT的输出软提示和文本片段的连续概率,该向量作为最后一步的输入。最后一步是对样本中的所有主题文本的预测结果的融合。在有少量可用训练样本的场景下,通过少量数据训练软提示以及线性层学习自适应权重。及线性层学习自适应权重。及线性层学习自适应权重。

【技术实现步骤摘要】
一种基于软提示主题建模的抑郁情绪检测方法及系统


[0001]本专利技术涉及情绪检测
,更具体的说是涉及一种基于软提示主题建模的抑郁情绪检测方法及系统。

技术介绍

[0002]抑郁症(Depression)是一种常见的心理障碍,表现为持续的情绪低落、失去兴趣和愉悦感,且常常伴随着一系列的生理和认知方面的症状,例如睡眠问题、食欲改变、注意力不集中、疲劳、自卑、消极思维、无助感等等。据世界卫生组织的统计数据,全球有超过3.4亿人患有抑郁症或其他情感障碍,而这个数字仍在持续增长。其发病过程较为漫长,对应于病情的严重程度可以分为轻度抑郁、中度抑郁和重度抑郁。轻度抑郁阶段的患者病情表现较轻,可能只是情绪低落、失眠、注意力不集中等问题,并不会影响其正常生活。正因为如此,也导致了抑郁症在早期难以被发觉,从而错过了最佳的治疗时期。此外,部分患者能够在早期意识到自己存在抑郁问题,却因为对患病感到羞愧而不愿接受治疗。随着病情的发展,患者会容易变得更为消极,开始自我否定。错过了早期阶段的最佳干预时期,此时再介入治疗已经十分困难。
[0003]一直以来,抑郁症检测主要通过专业的心理学家或心理医生基于国际疾病分类标准(international classification ofdiseases,ICD)和精神疾病诊断统计手册(diagnostic and statistical manual ofmental disorders,DSM)的临床访谈进行分析。但诊断结果都是基于医生的主观判断,医生的经验与专业性对于结果的准确性影响很大。因此,研究人员尝试利用机器学习以及深度学习的方法来构建抑郁症辅助诊断的模型,通过技术手段帮助医生客观准确地判断患者的抑郁状态,从而尽可能实现对早期阶段的抑郁症进行发现与干预。这样可以在一定程度上减轻抑郁症症状在患者未察觉的情况下加剧,从而变得难以治疗的情况,是一件十分具有现实意义的事情。
[0004]由于抑郁症检测任务本质上可以被视为一个情绪识别、分类问题,研究人员一直致力于开发基于机器学习及深度学习方法的分类模型。但是为了使模型获得令人满意的分类精度,往往需要准备大量的训练数据来使其学习数据中的规律。然而,与许多其他医学应用一样,抑郁症检测也面临数据稀缺问题。一方面,患者出于对隐私问题的担忧,往往不愿意将自己在诊断、治疗过程中的相关数据公之于众。另一方面,由于抑郁症的诊断方式并没有绝对统一的标准,并且抑郁症的症状受到多方面的影响(文化、生活环境、经济条件等等),通过不同的机构、医院所采集到的数据通常在形式上无法统一,因此数据往往无法通用。同时,专业的心理学家对所收集到的数据进行人工注释是一项劳动密集型的工作,抑郁症数据的采集、标注过程,都需要花费大量的人力物力以及时间,这些原因综合在一起便导致了抑郁症相关数据集存在数量少,且单个数据集体量小的问题。因此在真实的抑郁症检测场景中,只有很少甚至没有数据可以被用于训练模型的情况是不可避免的。
[0005]因此,如何构建更加有效、鲁棒和泛化能力较强的模型来实现低资源场景下的抑郁情绪检测是本领域技术人员亟需解决的问题。

技术实现思路

[0006]有鉴于此,本专利技术提供了一种基于软提示主题建模的抑郁情绪检测方法及系统,以应对低资源场景下的抑郁情绪检测精度低的问题。
[0007]为了实现上述目的,本专利技术提供如下技术方案:
[0008]一种基于软提示主题建模的抑郁情绪检测方法,包括以下步骤:
[0009]采集和预处理访谈文本,将所述访谈文本分割成多个主题文本;
[0010]构建改进的BERT模型,将所述主题文本输入至所述BERT模型,为所述主题文本添加软提示,并输出所述软提示与所述主题文本的连续概率;
[0011]对所述软提示与所述主题文本的连续概率进行融合,获得所述访谈文本的情绪检测结果。
[0012]优选的,所述预处理访谈文本,具体包括:将访谈文本按照预定义的k个主题{t1,t2,...,t
k
}分割成文本片段得到模型的输入表示如下:
[0013][0014]其中,代表主题t
k
对应的全部文本。
[0015]优选的,所述改进的BERT模型包括分词器、改进的Embedding层、BERT剩余层。
[0016]优选的,为所述主题文本添加软提示,具体步骤为:
[0017]针对每个主题文本,将每个主题文本与一段固定长度的空字符串连接,将所述主题文本与所述空字符串共同输入至分词器中,获得所述主题文本对应的Token,所述主题文本对应的Token表示如下
[0018][0019]其中,Token
none
为空字符对应的Token,为主题文本t
i
对应的Token,[SEP]为改进的BERT模型输入数据中用于连接两个句子的特殊符号,[CLS]和[EOS]分别是添加在输入内容前端和末尾的特殊Token;
[0020]将所述主题文本对应的Token输入到改进的Embedding层,Token
none
会被改进的Embedding层中的相同长度的软提示替代,完成软提示的添加。
[0021]优选的,所述输出软提示和主题文本的连续概率,表示为:
[0022][0023][0024]其中h[cls]是通过改进的Embedding层后[CLS]的输出,f(
·
)是分类函数,为输入的主题文本与学习所得的软提示连续的概率。
[0025]优选的,所述对输出软提示和主题文本的连续概率进行融合,获得所述访谈文本的情绪检测结果,具体采用线性层学习自适应权重方法,并通过加权融合获取最终预测结果。
[0026]优选的,使用神经网络来学习线性融合函数Linear(
·
),给主题分配不同的权重,最终预测可表示为:
[0027][0028]其中,Linear(
·
)代表输出纬度为1的线性层;预测结果为1代表抑郁情绪,0则代表非抑郁情绪。
[0029]优选的,选用二元交叉熵作为损失函数:
[0030][0031]其中和是第j个训练样本的真实标签和预测结果,N是训练样本总量。
[0032]另一方面,本专利技术还提供了一种用于实现上述任意一种基于软提示主题建模的抑郁情绪检测方法的检测系统,包括:文本获取模块、预处理模块、软提示预测模块、融合模块;
[0033]所述文本获取模块用于获取访谈文本,并将访谈文本发送至预处理模块;
[0034]所述预处理模块用于将所述访谈文本分割成多个主题文本;
[0035]所述软提示预测模块用于将所述主题文本输入至所述BERT模型,为所述主题文本添加软提示,并输出所述软提示与所述主题文本的连续概率;
[0036]所述融合模块用于将所述BERT模型输出的所述软提示与所述主题文本的连续概率进行融合,获得所述访谈文本的情绪检测结果。
[0037]经由上述的技术方案可本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于软提示主题建模的抑郁情绪检测方法,其特征在于,包括以下步骤:采集和预处理访谈文本,将所述访谈文本分割成多个主题文本;构建改进的BERT模型,将所述主题文本输入至所述BERT模型,为所述主题文本添加软提示,并输出所述软提示与所述主题文本的连续概率;对所述软提示与所述主题文本的连续概率进行融合,获得所述访谈文本的情绪检测结果。2.根据权利要求1所述的一种基于软提示主题建模的抑郁情绪检测方法,其特征在于,所述预处理访谈文本,具体包括:将访谈文本按照预定义的k个主题{t1,t2,...,t
k
}分割成文本片段得到模型的输入表示如下:其中,代表主题t
k
对应的全部文本。3.根据权利要求1所述的一种基于软提示主题建模的抑郁情绪检测方法,其特征在于,所述改进的BERT模型包括分词器、改进的Embedding层、BERT剩余层。4.根据权利要求3所述的一种基于软提示主题建模的抑郁情绪检测方法,为所述主题文本添加软提示,具体步骤为:针对每个主题文本,将每个主题文本与一段固定长度的空字符串连接,将所述主题文本与所述空字符串共同输入至分词器中,获得所述主题文本对应的Token,所述主题文本对应的Token表示如下:其中,Token
none
为空字符对应的Token,为主题文本t
i
对应的Token,[SEP]为改进的BERT模型输入数据中用于连接两个句子的特殊符号,[CLS]和[EOS]分别是添加在输入内容前端和末尾的特殊Token;将所述主题文本对应的Token输入到改进的Embedding层,Token
none
会被改进的Embedding层中的相同长度的软提示替代,完成软提示的添加。5.根据权利要求3所述的一种基于软提示主题建模的抑郁情绪...

【专利技术属性】
技术研发人员:郭艳蓉刘积隆郝世杰洪日昌
申请(专利权)人:合肥工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1