【技术实现步骤摘要】
一种基于声音判别抑郁症的检测方法
本专利技术属于语音处理
,更具体地说,涉及一种基于声音判别抑郁症的检测方法。
技术介绍
抑郁症是一种伴随有思想和行为异常的精神障碍,已经成为全球范围内严重的公共卫生和社会问题。2017年世界卫生组织发表的报告显示,全球有超过3亿人正在被抑郁症折磨,在中国,抑郁症患者人数已达5400万人(占人口的4.2%),此发病率与全球水平相近(4.4%);在中国15-24岁的年轻人中,约有120万人患有抑郁症;中国大学生抑郁症发病率高达23.8%(与英国大学数据相近);联合国儿童基金会2015年的报告显示,农村地区青少年抑郁症发病率高于城市同龄人;以中国为例,由抑郁症引起的缺勤、医药费和丧葬费每年造成78亿美元的损失。抑郁症表现为,患有本病的人外表看上去和正常人无异,实则内心痛苦不堪,经常会心情低落、意志消沉,从开始表现的闷闷不乐到自卑、社交困难,到后期甚至有自杀的想法或行为。为此,降低自杀率的有效办法之一就是提前做好检测,及时治疗,即基于有效的抑郁症检测方法。近年来,抑郁症诊断还是依赖于传统抑郁症检测方法例如SDS抑郁症自评量表,SDS主要适用于具有抑郁症状的成年人,它对心理咨询门诊及精神科门诊或住院精神病人均可使用。对严重阻滞症状的抑郁病人,评定有困难。国内外学者也做了大量研究,Ozdas等人基于声带抖动和声门波频谱范围探究造成抑郁症和自杀的风险因素。但是其实验样本数较少,缺少在大样本情况下的验证,且其实验样本的建立环境来自不同的通讯设备和环境。因此,对实验结果的准确性造成了一定的影响。 ...
【技术保护点】
1.一种基于声音判别抑郁症的检测方法,基于语音特征提取并深度学习处理的抑郁症判别,其特征在于,通过声音要素数据化的采集及存储,对声音文件数据进行BSS算法分析,对语音进行识别;使用MFCC作为特征参数分析所要处理的语音信号,转化到梅尔频率,进行倒谱分析;采用多组训练数据分别采集录音中的数据,建立卷积神经网络模型进行判别;使用BP神经网络方法对得到的测试样本数据进行分类分析;采用基于混淆矩阵的ROC、AUC模型评价方法,来判断基于声音判别个体患抑郁症概率的准确性。/n
【技术特征摘要】
1.一种基于声音判别抑郁症的检测方法,基于语音特征提取并深度学习处理的抑郁症判别,其特征在于,通过声音要素数据化的采集及存储,对声音文件数据进行BSS算法分析,对语音进行识别;使用MFCC作为特征参数分析所要处理的语音信号,转化到梅尔频率,进行倒谱分析;采用多组训练数据分别采集录音中的数据,建立卷积神经网络模型进行判别;使用BP神经网络方法对得到的测试样本数据进行分类分析;采用基于混淆矩阵的ROC、AUC模型评价方法,来判断基于声音判别个体患抑郁症概率的准确性。
2.一种根据权利要求1所述基于声音判别抑郁症的检测方法,其特征在于,包括以下具体步骤:
步骤S101、对收集的语音wav文件进行BSS算法分析,再进行声音数字化处理;
步骤S102、对语音物理信息进行编码运算,倒谱,得到MFCC的13维特征向量,供机器识别,对原始的MFCC的13维静态系数补充,转化为识别中用到的39维MFCC,分为:13静态系数+13一阶差分系数+13二阶差分系数,输入卷积神经网络模型;
步骤S103、建立卷积神经网络模型进行训练,自主提取选择特征;
步骤S104、BP网络端接收输出的特征向量,进行误差反传训练,把输入向量二分类;
步骤S105、用统计分析方法得到累计值,得出个体患抑郁症的概率;
步骤S106、利用AUC和ROC对二分类模型进行衡量评价,以支持准确度。
3.根据权利要求2所述的基于声音判别抑郁症的检测方法,其特征在于,所述步骤S101具体包括:
(1)对录音进行采样、量化、编码以保证精度;
(2)明确并主要提取声音信号数字化中的3个主要指标:采样频率、量化位数、声道数声。
4.根据权利要求2所述的基于声音判别抑郁症的检测方法,其特征在于,所述步骤S102具体包括:
(1)MFCC特征提取,包含两个关键步骤:转化到梅尔频率,然后进行倒谱分析;
(2)首先对时域信号进行傅里叶变换转换到频域,然后再利用梅尔频率刻度的滤波器组对应频域信号进行切分,最后每个频率段对应一个数值;
(3)倒谱分析是对时域信号做傅里叶变换,然后取log,再进行反傅里叶变换,可以分为复倒谱、实倒谱和功率倒谱,优先选择功率倒谱。
5.根据权利要求2所述的基于声音判别抑郁症的检测方法,其特征在于,所述MFCC提取特征的具体包括:
(1)预加重,频域乘以一个系数,系数跟频率成正相关,通过了一个H(z)=1-Kz-1高通滤波器,实现S′n=Sn-k*Sn-1;
(2)加窗,使用汉明窗对信号进行加窗处理S′n={0.54-0.46cos(2π(n-1)N-1)}*Sn;
(3)频域转换,将时域信号转化到频域进行后续的频率分析;
(4)使用梅尔刻度滤波器组过滤,对于FFT得到的幅度谱,分别跟每一个滤波器进行频率相乘累加,得到的值即为该帧数据在在该滤波器对应频段的能量值;
(5)能量值取log,取完log以后进行倒谱分析;
(6)离散余弦变换,进行反傅里叶变换然后通过低通滤波器获得最后的低频信号,获得最后的特征参数;
(7)差分,采用一阶差分和二阶差分,将13维的MFCC转化成39维MFCC输入卷积神经网络模型。
6.根据权利要求2所述的基于声音判别抑郁症的检测方法,其特征在于,所述步骤S103具体包括:
(1)第一个阶段是数据由低层次向高层次传播的阶段,即前向传播阶段;
(2)另外一个阶段是,当前向传播得出的结果与预期不相符时,将误差从高层次向底层次进行传播训练的阶段,...
【专利技术属性】
技术研发人员:陆可,李青青,赵双双,王颖捷,
申请(专利权)人:苏州国岭技研智能科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。