当前位置: 首页 > 专利查询>新疆大学专利>正文

一种基于时延神经网络与门控循环单元算法的抑郁症诊断方法与系统技术方案

技术编号:38468589 阅读:13 留言:0更新日期:2023-08-11 14:45
本发明专利技术提出一种基于时延神经网络与门控循环单元算法的抑郁症诊断方法与系统,其特征在于,(1)建立语音数据库,包括语音信号以及对应的抑郁症状态;(2)进行语音预处理,包括预加重、加窗及快速傅里叶变化等,使所需处理信号更加平滑;(3)语音特征提取,基于HuBERT模型进行实现,包括MFCC等特征提取以及Transformer编码结构对特征序列进行建模,从而实现对预处理后的语音中高层次表征的提取;(4)基于机器学习的分类,利用时延神经网络与门控循环单元算法对训练集进行学习,使用交叉熵损失函数度量模型预测结果与真实标签差距,通过反向传播算法更新网络参数进行训练及优化,输出抑郁症状态。状态。状态。

【技术实现步骤摘要】
一种基于时延神经网络与门控循环单元算法的抑郁症诊断方法与系统


[0001]本专利技术涉及人工智能辅助诊疗技术以及机器学习领域,特别是涉及一种基于语音特征与机器学习的抑郁症自动监测方法。

技术介绍

[0002]根据世界卫生组织(World Health Organization,WHO)调查显示,全世界约有10亿人存在着精神障碍类困扰,受全球新型冠状病毒的影响,全球抑郁症患者激增五千三百万,同时重度抑郁症患者及焦虑症患者分别增加了28%和26%,新型冠状病毒大流行给抑郁症的诊疗带来了巨大的挑战,同时抑郁症发病群体正在趋向年轻化趋势。
[0003]我国抑郁症诊断通常依靠医患交流及临床观察,面临着专科医师严重缺乏、初步筛查保健医生水平不一的困境,受限于当地医疗水平以及医生专业技能水平。而语音是人的生理状态的综合反映,随着语音信号分析处理技术的高速发展,基频、共振峰特征、线性预测系数、梅尔倒谱系数等语音特征参数可作为一个评估抑郁症相对客观并且可量化的指标,同时具有着容易采集及成本低的特点。因此,可以通过对用户语音特征的分析,为抑郁症的临床诊断提供一种基于用户实际表现的客观参考。

技术实现思路

[0004]本专利技术提供一种基于时延神经网络与门控循环单元算法的抑郁症诊断方法,基于语音预训练模型、特征提取、时延神经网络与门控循环单元等机器学习技术,通过寻找语音特征与抑郁症之间的关系,从而仅以通过语音读取的方式客观评估被试人员是否患有抑郁症的目的。
[0005]本专利技术公开了一种基于时延神经网络与门控循环单元算法的抑郁症诊断方法,所述包括如下步骤:
[0006]1)建立语音数据库,语音数据库模块在本系统的计算机中运行,用MySQL进行实现,其包含的数据有:语音文件的语音特征、受试人的抑郁状态(即人工诊断标签)、分类标签,该数据库中只保存经过专业医师诊断的被试数据。
[0007]2)进行语音预处理,包括预加重、加窗以及快速傅里叶变化等,用于提高语音质量,使得所需处理的信号更加平滑。
[0008]3)语音特征提取,特征提取基于HuBERT模型进行实现,包括MFCC与Fbank特征提取以及Transformer编码结构对特征序列进行建模,从而实现对预处理后的语音中高层次表征的提取。
[0009]4)基于机器学习进行分类,利用时延神经网络与门控制单元算法对训练集进行学习,并使用交叉熵损失函数来度量模型预测结果与真实标签的差距,通过反向传播算法更新网络参数进行训练及优化,得到的模型测试语音信号,并输出其对应的抑郁症状态作为判断被试者的抑郁筛查依据。
[0010]进一步,所述建立语音数据库,具体包括:
[0011](1)用于语音特征有效性分析、分类器训练优化的相关数据;
[0012](2)所述语音数据库模块运行在本系统的计算机上,用MySQL实现;
[0013](3)包含的数据为:语音文件的语音特征、受试人的抑郁状态(即人工诊断标签)、分类标签,该数据库中只保存经过专业医师诊断的被试数据。
[0014]进一步,所述进行语音预处理,具体包括:
[0015]1)预加重:对语音信号进行预加重;
[0016]2)加窗:将语音信号划分为一个个大小为N的帧。使用汉明窗对每一帧进行加窗。使用重叠

添加法将加窗后的帧重叠后相加,得到处理后的语音信号;
[0017]3)快速傅里叶变换,将信号从时域映射到频域。
[0018]进一步,所述语音特征提取,基于HuBERT模型实现,具体包括:
[0019]1)帧级特征提取:对MFCC、Fbank等特征进行提取;
[0020]2)频谱特征编码:将特征提取后的序列输入至卷积神经网络中,学习局部时序信息,捕获语音信号的局部特征;
[0021]3)预训练特征:将卷积神经网络的输出序列输入至Transformer Encoder中,利用自注意力机制对序列进行编码,学习全局时序信息,捕获语音信号的全局特征。同时,引入时域门卷积神经网络(MCNN)来增加时间维度的特征表示能力;
[0022]4)得到编码后的语音特征表示形式。
[0023]进一步,所述基于机器学习进行分类,具体包括:
[0024]1)建立时延神经网络:使用时间延迟神经网络对特征向量序列进行处理,其在时间维度上进行卷积操作,可以有效地捕捉时间序列数据的特征。即通过卷积和非线性激活函数操作对输入的特征序列进行处理;
[0025]2)建立门循环单元模型:使用门循环单元模型对经过时延神经网络处理得到的特征向量序列进行分类。门循环单元模型对输入序列进行建模并维护一个内部状态,以便于对序列信息进行编码和解码,更好地捕捉序列的长期依赖性;
[0026]3)训练及优化模型:首先使用交叉熵损失函数来度量模型预测结果与真实标签的差距,其次,通过反向传播算法更新网络参数,通过网络输入数据并计算每一层的加权和,并将其馈送到激活函数中。接着进行计算误差,随后,计算输出误差在各个层上的梯度,最后,通过更新参数的方式使误差降低;
[0027]4)抑郁症的诊断:使用训练好的模型对新的语音特征向量序列进行预测,并输出被试人是否患有抑郁症。
[0028]另一方面,本专利技术还提供了一种基于时延神经网络与门控循环单元算法的抑郁症诊断的系统,其包括:
[0029](1)语音数据库模块,用于语音特征有效性分析、分类器训练优化的相关数据;
[0030](2)语音预处理模块,用于对语音数据库中的语音数据进行预处理,便于后续表征抑郁程度或情感特征的语音特征提取;
[0031](3)特征提取模块,基于HuBERT模型,对能够表征被试人抑郁程度或情感特征的提取;
[0032](4)分类评估模块,利用时延神经网络与门控制单元算法对训练集进行学习,并使
用交叉熵损失函数来度量模型预测结果与真实标签的差距,通过反向传播算法更新网络参数进行训练及优化,得到的模型测试语音信号,并输出其对应的抑郁症状态作为判断被试者的抑郁筛查依据。
[0033]相对于现有技术,本专利技术有以下优点:
[0034]1)HuBERT模型可以对语音信号进行有效的预处理,提取出丰富的语音特征。与传统的基于梅尔倒谱系数的特征提取方法相比,HuBERT模型可以更好地保留语音信号中的上下文信息,从而提高了特征表达的质量;
[0035]2)时延神经网络和门循环单元模型在序列建模方面具有优异的性能。时延神经网络可以将多个时间步上的特征向量拼接起来,产生新的特征表示,并利用前馈神经网络进行映射,以进一步提高特征表达的准确性。门循环单元模型可以通过递归方式学习序列数据之间的依赖关系,从而更好地捕捉语音信号中存在的情感状态,提高了抑郁症识别的精度;
[0036]3)共同使用时延神经网络和门循环单元模型可以充分发挥两者的优势,提高整个系统的性能。时延神经网络可以生成新的特征表示,为序列建模提供更加丰富的输入,而门循环单本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于时延神经网络与门控循环单元算法的抑郁症诊断方法,其特征包含如下步骤:(1)建立语音数据库;(2)进行语音预处理;(3)语音特征提取;(4)基于机器学习进行分类。2.根据权利1所述的一种基于时延神经网络与门控循环单元算法的抑郁症诊断方法,其特征在于建立语音数据库,具体包括:(1)用于语音特征有效性分析、分类器训练优化的相关数据;(2)所述语音数据库模块运行在本系统的计算机上,用MySQL实现;(3)包含的数据为:语音文件的语音特征、受试人的抑郁状态(即人工诊断标签)、分类标签,该数据库中只保存经过专业医师诊断的被试数据。3.根据权利要求1所述的一种基于时延神经网络与门控循环单元算法的抑郁症诊断方法,其特征在于进行语音预处理,具体包括:(1)预加重:对语音信号进行预加重;(2)加窗:将语音信号划分为一个个大小为N的帧,使用汉明窗对每一帧进行加窗。使用重叠

添加法将加窗后的帧重叠后相加,得到处理后的语音信号;(3)快速傅里叶变换,将信号从时域映射到频域。4.根据权利要求1所述的一种基于时延神经网络和门控循环单元算法的抑郁症诊断方法,其特征在于语音特征提取,基于HuBERT模型实现,具体包括:(1)帧级特征提取:对MFCC、Fbank等特征进行提取;(2)频谱特征编码:将特征提取后的序列输入至卷积神经网络中,学习局部时序信息,捕获语音信号的局部特征;(3)预训练特征:将卷积神经网络的输出序列输入至Transformer Encoder中,利用自注意力机制对序列进行编码,学习全局时序信息,捕获语音信号的全局特征,同时,引入时域门卷积神经网络(MCNN)来增加时间维度的特征表示能力;(4)得到编码后的语音特征表示形式。5.根据权利要求1...

【专利技术属性】
技术研发人员:何亮叶子豪
申请(专利权)人:新疆大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1