【技术实现步骤摘要】
一种基于时延神经网络的语音抑郁症自动检测方法和装置
[0001]本专利技术涉及语音处理
,尤其涉及一种基于时延神经网络的语音抑郁症自动检测方法和装置。
技术介绍
[0002]抑郁症是一种常见的精神疾病,主要表现为情绪低落,思维迟缓和意志减退,已经成为了目前世界范围内主要的健康问题之一。造成抑郁症危害严重的另一因素是目前对于抑郁症的诊断缺乏客观的检查手段,对于其评估和诊断主要依赖于神经科医生的精神检查,很大程度上依赖医生的主观经验,而诊断工具也仅限于调查问卷以及诊断量表。
[0003]现有的抑郁症诊断方法主要依靠医生的诊断经验,因此对医生的经验要求较高,对于经验较少的医生难以保证诊断质量。
[0004]语音作为人类传递信息的最直接的方式,其中蕴含了大量人类健康状态的信息,已有大量研究表明抑郁症患者的发音特点正常人相比具有显著差异,比如基频、响度以及语速等相关特征会产生较大变化。
[0005]因此,现有技术亟需一种基于人工智能与语音信号处理技术的抑郁症诊断方法。
技术实现思路
[00 ...
【技术保护点】
【技术特征摘要】
1.一种基于时延神经网络的语音抑郁症自动检测方法,其特征在于,所述方法的步骤包括,获取初始语音信号,将所述初始语音信号划分为多个语音段,每个语音段包括至少一个语音帧,分别计算所述初始语音信号中每一个语音段的短时能量与短时过零率;基于所述短时能量获取所述初始语音信号的语音段中的浊音片段,基于所述短时过零率获取所述初始语音信号的语音段中的清音片段,组合初始语音信号中的所有浊音片段和清音片段,得到有效语音片段;对每个所述有效语音片段进行预加重处理,对预加重处理后的有效语音片段基于时间进行分帧,得到多个帧片段,计算每个帧片段对应的梅尔频率倒谱系数;将所述梅尔频率倒谱系数输入预设的时延神经网络模型中,基于所述时延神经网络模型的特征提取模块计算得到梅尔频率倒谱系数对应的特征向量,基于所述时延神经网络模型的特征汇聚模块计算得到每个特征向量对应的均值和方差,将每个特征向量对应的均值和方差输入所述时延神经网络模型的分类模块,得到概率参数。2.根据权利要求1所述的基于时延神经网络的语音抑郁症自动检测方法,其特征在于,在将所述梅尔频率倒谱系数输入预设的时延神经网络模型中的步骤之前还包括步骤,对所述梅尔频率倒谱系数通过频谱遮罩进行特征数据增强,将增强后的梅尔频率倒谱系数输入预设的时延神经网络模型。3.根据权利要求1所述的基于时延神经网络的语音抑郁症自动检测方法,其特征在于,在分别计算所述初始语音信号中每一个语音段的短时能量与短时过零率的步骤中,基于如下公式计算短时能量:E
x
表示语音段x的短时能量,N表示语音段x中的帧总数,n表示N个的帧中的任一个,x[n]表示N帧中的第n帧的幅值;在分别计算所述初始语音信号中每一个语音段的短时能量与短时过零率的步骤中,基于如下公式计算短时过零率:Z
x
表示语音段x的短时过零率,N表示语音段x中的帧总数,n表示N个的帧中的任一个,x(n)表示N帧中的第n帧的幅值,x(n
‑
1)表示N帧中的第n
‑
1帧的幅值,sgn表示符号函数。4.根据权利要求1所述的基于时延神经网络的语音抑郁症自动检测方法,其特征在于,在基于所述短时能量获取所述初始语音信号的语音段中的浊音片段,基于所述短时过零率获取所述初始语音信号的语音段中的清音片段的步骤中,预设短时能量阈值和短时过零率阈值;基于对比每个语音段的短时能量值和短时能量阈值,获取语音段中的浊音片段;基于对比每个语音段的短时过零率值和短时过零率阈值,获取语音段中的清音片段。5.根据权利要求1所述的基于时延神经网络的语音抑郁症自动检测方法,其特征在于,
在对预加重处理后的有效语音片段基于时间进行分帧,得到多个帧片段,计算每个帧片段对应的梅尔频率倒谱系数的步骤包括:在对预加重处理后的有效语音片段基于时间进行分帧,得到多个帧片段的步骤中,将每第一时间长度的有效语音片段划分为一个帧片段,相邻的帧片段存在第二时间长度的重合段;对每个帧片段基于窗函数进行加窗处理;对加窗后的帧片段进行快速傅里叶变换,将时域信号转化为频域信号;基于梅尔滤波器将频域信号的频率转化到梅尔频率,得到梅尔频率信号;对梅尔频率信号进行反傅里叶变换,将梅尔频率信号转化到时域,得到梅尔频率倒谱系数。6.根据权利要求1
‑
5任一项所述的基于时延神经网络的语音抑郁症自动检测方法,其特征在于,所述特征提取模块包括多个连续的Se
‑
Res2模块,每个Se
‑
Res2模块设置有Res2Net层进行卷积处理,所述特征提取模块...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。