【技术实现步骤摘要】
用于抑郁检测的预训练方法和抑郁检测方法及装置
本专利技术属于神经网络
,尤其涉及用于抑郁检测的预训练方法和抑郁检测方法及装置。
技术介绍
抑郁症是一种引起人们广泛关注的疾病,已经影响到全世界3亿多人。随着抑郁症的严重程度在没有充分治愈的情况下增长,患有这种疾病的人将遭受多种症状,包括失眠,失去兴趣以及在极端时自杀。越来越多的研究涉及自动抑郁症的检测和严重程度的预测,特别是对话性语音,其中嵌入了有关人的精神状态的重要信息。但是,到目前为止,这些模型受到抑郁数据十分有限的严重限制,导致精度提高和再现困难。在过去的几十年中,抑郁症检测的研究有所增加,因为该疾病已成为社会关注的问题。现有技术中,研究自动抑郁检测方法的主要瓶颈,在于可用的数据十分有限。因此,一般在进行抑郁症检测时,大多数人会选用多模态,即语音,视频以及文字等数据进行模态融合,或者仅仅使用文字进行检测,这样可以使得特征与人声或者人的说话内容更相关。由于音频中经常存在很多与说话人无关的信息,比如噪音,所以检测的精度较差。
技术实现思路
本专利技术实施例提 ...
【技术保护点】
1.一种用于抑郁检测的预训练方法,包括:/n将从训练音频中提取的频谱图特征切分为N个子频谱图特征;/n在所述N个子频谱图特征的中心M
【技术特征摘要】
1.一种用于抑郁检测的预训练方法,包括:
将从训练音频中提取的频谱图特征切分为N个子频谱图特征;
在所述N个子频谱图特征的中心M0的前后分别选取k个子频谱图特征,其中,k<(N-1)/2;
将M0的前k个子频谱图特征和后k个子频谱图特征合记为Mi,将Mi输入编码器;
以中心子频谱图特征M0作为目标标签,训练所述编码器和解码器以使得所述编码器和所述解码器能够利用Mi预测M0。
2.根据权利要求1所述的方法,其中,所述训练所述编码器和解码器以使得所述编码器和所述解码器能够利用Mi预测M0包括:
计算Mi和M0的平均绝对误差,训练所述编码器和所述解码器以使得所述平均绝对误差小于等于预设阈值。
3.根据权利要求1或2所述的方法,其中,所述频谱图特征包括梅尔频谱特征和短时傅立叶变换特征,所述子频谱图特征包括96帧的子频谱图中的特征。
4.根据权利要求3所述的方法,其中,所述编码器和所述解码器均为卷积神经网络。
5.一种抑郁检测方法,包括:
将待检测语音输入至根据权利要求1-4中任一项所述的方法训练的编码器中,获取所述编码器的输出;
将所述编码器的输出输入至抑郁判别网络中,获取所述抑郁判别网络输出的与所述待检测语音对应的抑郁状况。
6.根据权利要求5所述的方法,其中,所述抑...
【专利技术属性】
技术研发人员:俞凯,吴梦玥,丁翰林,张平越,
申请(专利权)人:苏州思必驰信息科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。