【技术实现步骤摘要】
一种基于面部视频的抑郁症自动识别方法
[0001]本专利技术涉及计算机识别
,具体为一种基于面部视频的抑郁症自动识别方法
。
技术介绍
[0002]抑郁症是一种非常严重的精神疾病,具有发病率高
、
多次复发的特点,且伴有年轻化的趋势
。
但是抑郁症目前并没有独特有效的临床特征,在多数情况下,抑郁症的诊断需要通过结构化临床访谈
、
抑郁量表识别等方法,且高度依赖临床医生的经验
。
整个过程缺乏客观有效的依据且耗时较长
。
因此,迫切需要一种客观有效且快速的方法进行抑郁识别
。
[0003]由于抑郁症患者的面部表情往往存在明显的和悲伤有关的特征,因此情感计算领域的研究人员尝试利用心理学和计算机视觉领域的知识,通过面部视觉特征自动识别抑郁症
。
早期的面部抑郁症识别方法需要手工提取面部特征,例如使用局部相位量化
(Local Phase Quantisation
,
LPQ)
获取视觉特征,使用支持向量回归
(Support Vector Regressor
,
SVR)
进行回归预测
。
这种手工的特征提取方法需要精心设计,且依赖于专家的先验知识
。
[0004]与手工特征提取的方法相比,深度学习具有强大的特征提取能力,一些深度学习模型被用来从面部视频中捕获与抑郁症相关的特征,从而进行抑郁症识别 >。
深度学习方法的有效性依赖于可靠的数据集
。
但是抑郁症涉及到患者隐私,因此该领域一直难以获得可靠的大规模数据集供模型训练
。
[0005]目前,一些深度学习方法使用深度标签分布学习预测抑郁标签分布,通过计算标签分布的数学期望获得预测的抑郁得分,但忽略了探索面部抑郁标签分布形式以及抑制噪声标签信息
。
基于现有研究存在两方面的问题,在有限的面部抑郁数据集中捕获更多面部特征,探索抑郁症患者之间的面部差异成为后续研究的重点
。
技术实现思路
[0006]针对现有技术中存在的问题,本专利技术的目的是:提供一种基于面部视频的抑郁症自动识别方法,通过该方法能够在不增加数据集的前提下,提升模型的特征提取能力,提高面部抑郁识别的精度和鲁棒性
。
[0007]为了达到上述目的,本专利技术采用如下技术方案:
[0008]一种基于面部视频的抑郁症自动识别方法,包括以下步骤,
[0009]获取待识别的面部视频数据并进行预处理,获得面部视频子样本
V
c
;
[0010]构建联合学习抑郁标签分布和标签度量的深度学习模型
LDSML
;
[0011]将子样本
V
c
输入到
LDSML
深度学习模型中进行训练;
[0012]在模型输出端使用带温度系数的
Softmax
‑
T
激活函数,得到预测的抑郁标签分布
p
,计算该标签分布的数学期望值
E
;
[0013]预测阶段,使用预测的抑郁标签分布
P
的数学期望值
E
表示最终的抑郁症预测结
果
。
[0014]进一步,深度学习模型
LDSML
基于
I3D
‑
Resnet50
神经网络模型构建,该网络使用四个残差模块提取时空特征,最后通过一层全连接层输出
128
维标签分布特征
。
[0015]进一步,采用标签分布学习解决面部抑郁症识别,深度学习模型经过
Softmax
‑
T
输出抑郁标签分布,并采用更高的标签分布划分精度,以便模型捕获隐含的标签信息
。
[0016]进一步,通过调整
Softmax
‑
T
激活函数的温度系数
t
的大小,减少抑郁标签分布
p
中冗余的噪声标签信息,鼓励模型在训练过程中更加关注真实的抑郁标签,其公式为:其中
t
是用于调节输出标签分布的温度系数
。
[0017]进一步,在模型训练阶段,计算子样本
V
c
的期望抑郁得分
E
和真实标签
l
之间的损失函数,其计算公式为,
[0018]其中,
J
表示
LDSML
框架的总损失函数,
J
er
表示期望回归损失函数,
J
bsm
表示批量样本期望监督度量损失函数,
N
表示同时输入
N
批样本,
α
表示
J
bsm
的权重
。
[0019]进一步,训练阶段,使用期望回归损失函数
J
er
最小化抑郁标签分布
P
的数学期望值
E
与真实标签
l
之间的距离,其计算公式为,之间的距离,其计算公式为,其中
M
表示样本数
。
[0020]进一步,训练阶段,使用批量样本期望监督度量损失
J
bsm
最小化每批样本中样本间期望距离和真实距离之间的差异,其计算公式为:
[0021]D
ij,E
=
E
i
‑
E
j
;
[0022]D
ij,l
=
l
i
‑
l
j
;
[0023]J
sm
(x
i
,x
j
)
=
||D
ij,E
‑
D
ij,l
||2;
[0024]其中,
D
表示两个样本的标签或者期望抑郁得分间的距离
。
[0025]进一步,使用批量样本期望监督度量损失
J
bsm
充分捕捉每批训练中所有样本的距离标签信息,其计算公式为:
[0026][0027]其中
P(m)
表示样本对的数目
。
[0028]进一步,损失函数
J
bsm
充分利用每批训练样本中所有子样本的距离标签信息,探索顺序标签之间的关联信息,从而能够捕获更多不同抑郁症患者之间的面部差异特征
。
[0029]总的说来,本专利技术具有如下优点:
[0030]通过深度标签分布学习和有监督度量学习,有效地学习了抑郁标签分布信息以及样本间的差异
本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.
一种基于面部视频的抑郁症自动识别方法,其特征在于:包括以下步骤,获取待识别的面部视频数据并进行预处理,获得面部视频子样本
V
c
;构建联合学习抑郁标签分布和标签度量的深度学习模型
LDSML
;将子样本
V
c
输入到
LDSML
深度学习模型中进行训练;在模型输出端使用带温度系数的
Softmax
‑
T
激活函数,得到预测的抑郁标签分布
p
,计算该标签分布的数学期望值
E
;预测阶段,使用预测的抑郁标签分布
P
的数学期望值
E
表示最终的抑郁症预测结果
。2.
根据权利要求1所述的一种基于面部视频的抑郁症自动识别方法,其特征在于:深度学习模型
LDSML
基于
I3D
‑
Resnet50
神经网络模型构建,该网络使用四个残差模块提取时空特征,最后通过一层全连接层输出
128
维标签分布特征
。3.
根据权利要求1所述的一种基于面部视频的抑郁症自动识别方法,其特征在于:采用标签分布学习解决面部抑郁症识别,深度学习模型经过
Softmax
‑
T
输出抑郁标签分布,并采用更高的标签分布划分精度,以便模型捕获隐含的标签信息
。4.
根据权利要求3所述的一种基于面部视频的抑郁症自动识别方法,其特征在于:通过调整
Softmax
‑
T
激活函数的温度系数
t
的大小,减少抑郁标签分布
p
中冗余的噪声标签信息,鼓励模型在训练过程中更加关注真实的抑郁标签,其公式为:其中
t
是用于调节输出标签分布的温度系数
。5.
根据权利要求1所述的一种基于面部视频的抑郁症自动识别方法,其特征在于:在模型训练阶段,计算子样本
V
c
的期望抑郁得分
E
和真实标签
l
之间的损失函数,其计算公式为,其中,
J
表示
LDSML
框架的总损失函数,<...
【专利技术属性】
技术研发人员:胡国清,徐泽宇,付西敏,陈佳,赵芮,
申请(专利权)人:广东寰宇智慧医疗科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。