一种基于时延神经网络与门控循环单元算法的抑郁症诊断方法与系统技术方案

技术编号：38468589 阅读：13 留言：0更新日期：2023-08-11 14:45

本发明专利技术提出一种基于时延神经网络与门控循环单元算法的抑郁症诊断方法与系统,其特征在于，（1）建立语音数据库，包括语音信号以及对应的抑郁症状态；（2）进行语音预处理，包括预加重、加窗及快速傅里叶变化等,使所需处理信号更加平滑；（3）语音特征提取，基于HuBERT模型进行实现,包括MFCC等特征提取以及Transformer编码结构对特征序列进行建模，从而实现对预处理后的语音中高层次表征的提取；（4）基于机器学习的分类，利用时延神经网络与门控循环单元算法对训练集进行学习，使用交叉熵损失函数度量模型预测结果与真实标签差距，通过反向传播算法更新网络参数进行训练及优化,输出抑郁症状态。状态。状态。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于时延神经网络与门控循环单元算法的抑郁症诊断方法与系统

[0001]本专利技术涉及人工智能辅助诊疗技术以及机器学习领域，特别是涉及一种基于语音特征与机器学习的抑郁症自动监测方法。

技术介绍

[0002]根据世界卫生组织(World Health Organization,WHO)调查显示，全世界约有10亿人存在着精神障碍类困扰，受全球新型冠状病毒的影响，全球抑郁症患者激增五千三百万，同时重度抑郁症患者及焦虑症患者分别增加了28％和26％，新型冠状病毒大流行给抑郁症的诊疗带来了巨大的挑战，同时抑郁症发病群体正在趋向年轻化趋势。
[0003]我国抑郁症诊断通常依靠医患交流及临床观察，面临着专科医师严重缺乏、初步筛查保健医生水平不一的困境，受限于当地医疗水平以及医生专业技能水平。而语音是人的生理状态的综合反映，随着语音信号分析处理技术的高速发展，基频、共振峰特征、线性预测系数、梅尔倒谱系数等语音特征参数可作为一个评估抑郁症相对客观并且可量化的指标，同时具有着容易采集及成本低的特点。因此，可以通过对用户语音特征的分析，为抑郁症的临床诊断提供一种基于用户实际表现的客观参考。

技术实现思路

[0004]本专利技术提供一种基于时延神经网络与门控循环单元算法的抑郁症诊断方法，基于语音预训练模型、特征提取、时延神经网络与门控循环单元等机器学习技术，通过寻找语音特征与抑郁症之间的关系，从而仅以通过语音读取的方式客观评估被试人员是否患有抑郁症的目的。
[0005]本专利技术公开了一种基于时延神经网络与...

【技术保护点】

【技术特征摘要】
1.一种基于时延神经网络与门控循环单元算法的抑郁症诊断方法，其特征包含如下步骤：（1）建立语音数据库；（2）进行语音预处理；（3）语音特征提取；（4）基于机器学习进行分类。2.根据权利1所述的一种基于时延神经网络与门控循环单元算法的抑郁症诊断方法，其特征在于建立语音数据库，具体包括：（1）用于语音特征有效性分析、分类器训练优化的相关数据；（2）所述语音数据库模块运行在本系统的计算机上，用MySQL实现；（3）包含的数据为：语音文件的语音特征、受试人的抑郁状态（即人工诊断标签）、分类标签，该数据库中只保存经过专业医师诊断的被试数据。3.根据权利要求1所述的一种基于时延神经网络与门控循环单元算法的抑郁症诊断方法，其特征在于进行语音预处理，具体包括：（1）预加重：对语音信号进行预加重；（2）加窗：将语音信号划分为一个个大小为N的帧，使用汉明窗对每一帧进行加窗。使用重叠
‑
添加法将加窗后的帧重叠后相加，得到处理后的语音信号；（3）快速傅里叶变换，将信号从时域映射到频域。4.根据权利要求1所述的一种基于时延神经网络和门控循环单元算法的抑郁症诊断方法，其特征在于语音特征提取，基于HuBERT模型实现，具体包括：（1）帧级特征提取：对MFCC、Fbank等特征进行提取；（2）频谱特征编码：将特征提取后的序列输入至卷积神经网络中，学习局部时序信息，捕获语音信号的局部特征；（3）预训练特征：将卷积神经网络的输出序列输入至Transformer Encoder中，利用自注意力机制对序列进行编码，学习全局时序信息，捕获语音信号的全局特征，同时，引入时域门卷积神经网络（MCNN）来增加时间维度的特征表示能力；（4）得到编码后的语音特征表示形式。5.根据权利要求1...

【专利技术属性】
技术研发人员：何亮，叶子豪，
申请(专利权)人：新疆大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人