一种基于声音判别抑郁症的检测方法技术

技术编号:26381182 阅读:22 留言:0更新日期:2020-11-19 23:50
本发明专利技术公开了一种基于声音判别抑郁症的检测方法,基于语音特征提取并深度学习处理的抑郁症判别;通过声音要素数据化的采集及存储,对声音文件数据进行BSS算法分析,对语音进行识别;使用MFCC作为特征参数分析所要处理的语音信号,转化到梅尔频率,进行倒谱分析;采用多组训练数据分别采集录音中的数据,建立卷积神经网络模型进行判别;使用BP神经网络方法对得到的测试样本数据进行分类分析;采用基于混淆矩阵的ROC,AUC模型评价方法,来判断基于声音判别个体患抑郁症的概率的准确性。抑郁症判别率有显著提高,且成本低廉。

【技术实现步骤摘要】
一种基于声音判别抑郁症的检测方法
本专利技术属于语音处理
,更具体地说,涉及一种基于声音判别抑郁症的检测方法。
技术介绍
抑郁症是一种伴随有思想和行为异常的精神障碍,已经成为全球范围内严重的公共卫生和社会问题。2017年世界卫生组织发表的报告显示,全球有超过3亿人正在被抑郁症折磨,在中国,抑郁症患者人数已达5400万人(占人口的4.2%),此发病率与全球水平相近(4.4%);在中国15-24岁的年轻人中,约有120万人患有抑郁症;中国大学生抑郁症发病率高达23.8%(与英国大学数据相近);联合国儿童基金会2015年的报告显示,农村地区青少年抑郁症发病率高于城市同龄人;以中国为例,由抑郁症引起的缺勤、医药费和丧葬费每年造成78亿美元的损失。抑郁症表现为,患有本病的人外表看上去和正常人无异,实则内心痛苦不堪,经常会心情低落、意志消沉,从开始表现的闷闷不乐到自卑、社交困难,到后期甚至有自杀的想法或行为。为此,降低自杀率的有效办法之一就是提前做好检测,及时治疗,即基于有效的抑郁症检测方法。近年来,抑郁症诊断还是依赖于传统抑郁症检测方法例如SDS抑郁症自评量表,SDS主要适用于具有抑郁症状的成年人,它对心理咨询门诊及精神科门诊或住院精神病人均可使用。对严重阻滞症状的抑郁病人,评定有困难。国内外学者也做了大量研究,Ozdas等人基于声带抖动和声门波频谱范围探究造成抑郁症和自杀的风险因素。但是其实验样本数较少,缺少在大样本情况下的验证,且其实验样本的建立环境来自不同的通讯设备和环境。因此,对实验结果的准确性造成了一定的影响。此外,国内外也有一些期刊文献公开了基于声音来检测抑郁症的方法,例如杨楚珺等人研究了《基于语音和面部特征的抑郁症识别技术研究》,基于语音特征部分,对访谈中记录的音频数据进行分析。数据集提供的音频特征由COVAREP算法从音频记录文件中提取。每0.3334s为一一个时间戳,提取的音频特征记录在每个时间戳下。根据音频特征的时序特性,建立长短期记忆网络(LSTM),同时对数据集按照性别进行分类,将这些特征按照时间戳的顺序,作为长短期记忆网络(LSTM)的输入,得到一个基于音频特征的预测结果。王田阳等人研究了《基于语音数据的有效特征分析及其在抑郁水平评估中的应用》,本文使用GMM建立多特征集决策系统,在多个特征集上分别训练模型,然后对预测结果进行决策融合,在男、女数据上分别得到了70%、75%的分类准确率。此外,国内也有一些专利文献公开了基于声音来检测抑郁症的方法,例如中国专利CN106725532A公开了一种基于语音特征与机器学习的抑郁症自动评估系统和方法,基于语音处理、特征提取、机器学习技术,寻找语音特征与抑郁症之间的联系,为抑郁症的临床诊断提供客观参考依据。中国专利CN107657964A公开了一种基于声学特征和稀疏数学的抑郁症辅助检测方法及分类器,,基于语音和面部情绪共同识别的抑郁症判别;通过逆滤波器实现声门信号的估计,对语音信号采用全局分析,提取特征参数,分析特征参数的时序和分布特点,找到不同情感语音的韵律规律作为情感识别的依据;使用MFCC作为特征参数分析所要处理的语音信号,并用多组训练数据分别采集录音中的数据,建立神经网络模型进行判别。中国专利CN109171769A公开了一种应用于抑郁症检测的语音、面部特征提取方法及系统,根据能量信息法将音频数据进行特征提取,得到频谱参数和声学参数;将上述参数输入第一深度神经网络模型,得到语音深度特征数据;将视频图像进行静态特征提取,得到帧图像;将帧图像输入第二深度神经网络模型,得到面部特征数据;将视频图像进行动态特征提取,得到光流图像;将光流图像输入第三深度神经网络模型,得到面部运动特征数据;将面部特征数据和运动特征数据输入第三深度神经网络模型,得到面部深度特征数据;将语音深度特征数据和面部深度特征数据输入第四神经网络模型,得到融合数据。中国专利CN111329494A公开了一种基于语音关键词检索和语音情绪识别的抑郁症检测方法,通过采集待测人员的语音信息,可以利用从语音信息中提取到的语音特征和语音文本,对待测人员的抑郁情况进行自动识别。虽然已经有很多尝试用神经网络来检测基于音频的depression,但现有的方法在训练时用单个音频62文件标记一个样本,最终输出总预测准确率,且单个文件没有63个预测正确的概率。本专利技术就是通过从单个文件进行处理,针对单个个体的独特性进行预估判断,更具有代表性。综上所述,现有的技术存在的问题是:传统抑郁症检测方法是基于SDS抑郁症自评量表和临床医生的主观判断,存在较大的误差,基于MFCC语音特征提取后没有采用BP神经网络算法二分类以及AUC精确度验证,检测方法缺乏科学性,缺乏有效的客观评价指标。
技术实现思路
1.要解决的问题针对现有技术中的不足,本专利技术提供一种基于声音判别抑郁症的检测方法,在抑郁症识别率方面有很大的提升,并且方法系统可以在医院检测仪或电脑上轻松搭建,软硬件成本低廉。2.技术方案为了解决上述问题,本专利技术所采用的技术方案如下:本专利技术的一种基于声音判别抑郁症的检测方法,所述基于声音判别抑郁症的检测方法基于语音特征提取并深度学习处理的抑郁症判别;通过声音要素数据化的采集及存储,对声音文件数据进行BSS算法分析,对语音进行识别;使用MFCC作为特征参数分析所要处理的语音信号,转化到梅尔频率,进行倒谱分析;采用多组训练数据分别采集录音中的数据,建立卷积神经网络模型进行判别;使用BP神经网络方法对得到的测试样本数据进行分类分析;采用基于混淆矩阵的ROC,AUC模型评价方法,来判断基于声音判别个体患抑郁症的概率的准确性。本专利技术的一种基于声音判别抑郁症的检测方法,包括以下步骤:步骤S101、对收集的语音wav文件进行BSS算法分析,再进行声音数字化处理;步骤S102、对语音物理信息进行编码运算,倒谱(频谱包络和细节),得到MFCC的13维特征向量,供机器识别,对原始的MFCC的13维静态系数补充,转化为识别中用到的39维MFCC,分为:13静态系数+13一阶差分系数+13二阶差分系数,输入卷积神经网络模型;步骤S103、建立卷积神经网络模型进行训练,自主提取选择特征;步骤S104、BP网络端接收输出的特征向量,进行误差反传训练,把输入向量二分类;步骤S105、用统计分析方法得到累计值,得出个体患抑郁症的概率;步骤S106、利用AUC和ROC对二分类模型进行衡量评价,以支持准确度。进一步,所述步骤S101具体包括:(1)对录音进行采样,量化,编码以保证精度;(2)明确并主要提取声音信号数字化中的3个主要指标:采样频率、量化位数、声道数声。进一步,所述步骤S102具体包括:(1)MFCC特征提取,包含两个关键步骤:转化到梅尔频率,然后进行倒谱分析;(2)梅尔刻度的滤波器组在低频部分的分辨率高,跟人耳的听觉特性是相符的,这也是梅尔刻度的物理意义所在,转化到梅尔频率这一步的含义是首先对时域信号进本文档来自技高网
...

【技术保护点】
1.一种基于声音判别抑郁症的检测方法,基于语音特征提取并深度学习处理的抑郁症判别,其特征在于,通过声音要素数据化的采集及存储,对声音文件数据进行BSS算法分析,对语音进行识别;使用MFCC作为特征参数分析所要处理的语音信号,转化到梅尔频率,进行倒谱分析;采用多组训练数据分别采集录音中的数据,建立卷积神经网络模型进行判别;使用BP神经网络方法对得到的测试样本数据进行分类分析;采用基于混淆矩阵的ROC、AUC模型评价方法,来判断基于声音判别个体患抑郁症概率的准确性。/n

【技术特征摘要】
1.一种基于声音判别抑郁症的检测方法,基于语音特征提取并深度学习处理的抑郁症判别,其特征在于,通过声音要素数据化的采集及存储,对声音文件数据进行BSS算法分析,对语音进行识别;使用MFCC作为特征参数分析所要处理的语音信号,转化到梅尔频率,进行倒谱分析;采用多组训练数据分别采集录音中的数据,建立卷积神经网络模型进行判别;使用BP神经网络方法对得到的测试样本数据进行分类分析;采用基于混淆矩阵的ROC、AUC模型评价方法,来判断基于声音判别个体患抑郁症概率的准确性。


2.一种根据权利要求1所述基于声音判别抑郁症的检测方法,其特征在于,包括以下具体步骤:
步骤S101、对收集的语音wav文件进行BSS算法分析,再进行声音数字化处理;
步骤S102、对语音物理信息进行编码运算,倒谱,得到MFCC的13维特征向量,供机器识别,对原始的MFCC的13维静态系数补充,转化为识别中用到的39维MFCC,分为:13静态系数+13一阶差分系数+13二阶差分系数,输入卷积神经网络模型;
步骤S103、建立卷积神经网络模型进行训练,自主提取选择特征;
步骤S104、BP网络端接收输出的特征向量,进行误差反传训练,把输入向量二分类;
步骤S105、用统计分析方法得到累计值,得出个体患抑郁症的概率;
步骤S106、利用AUC和ROC对二分类模型进行衡量评价,以支持准确度。


3.根据权利要求2所述的基于声音判别抑郁症的检测方法,其特征在于,所述步骤S101具体包括:
(1)对录音进行采样、量化、编码以保证精度;
(2)明确并主要提取声音信号数字化中的3个主要指标:采样频率、量化位数、声道数声。


4.根据权利要求2所述的基于声音判别抑郁症的检测方法,其特征在于,所述步骤S102具体包括:
(1)MFCC特征提取,包含两个关键步骤:转化到梅尔频率,然后进行倒谱分析;
(2)首先对时域信号进行傅里叶变换转换到频域,然后再利用梅尔频率刻度的滤波器组对应频域信号进行切分,最后每个频率段对应一个数值;
(3)倒谱分析是对时域信号做傅里叶变换,然后取log,再进行反傅里叶变换,可以分为复倒谱、实倒谱和功率倒谱,优先选择功率倒谱。


5.根据权利要求2所述的基于声音判别抑郁症的检测方法,其特征在于,所述MFCC提取特征的具体包括:
(1)预加重,频域乘以一个系数,系数跟频率成正相关,通过了一个H(z)=1-Kz-1高通滤波器,实现S′n=Sn-k*Sn-1;
(2)加窗,使用汉明窗对信号进行加窗处理S′n={0.54-0.46cos(2π(n-1)N-1)}*Sn;
(3)频域转换,将时域信号转化到频域进行后续的频率分析;
(4)使用梅尔刻度滤波器组过滤,对于FFT得到的幅度谱,分别跟每一个滤波器进行频率相乘累加,得到的值即为该帧数据在在该滤波器对应频段的能量值;
(5)能量值取log,取完log以后进行倒谱分析;
(6)离散余弦变换,进行反傅里叶变换然后通过低通滤波器获得最后的低频信号,获得最后的特征参数;
(7)差分,采用一阶差分和二阶差分,将13维的MFCC转化成39维MFCC输入卷积神经网络模型。


6.根据权利要求2所述的基于声音判别抑郁症的检测方法,其特征在于,所述步骤S103具体包括:
(1)第一个阶段是数据由低层次向高层次传播的阶段,即前向传播阶段;
(2)另外一个阶段是,当前向传播得出的结果与预期不相符时,将误差从高层次向底层次进行传播训练的阶段,...

【专利技术属性】
技术研发人员:陆可李青青赵双双王颖捷
申请(专利权)人:苏州国岭技研智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1