【技术实现步骤摘要】
本专利技术涉及精神医学与数据分析的交叉领域,具体是涉及到一种基于语音多尺度时域感知的抑郁状态预测方法及系统。
技术介绍
1、抑郁症是一种常见且高患病率的情绪障碍,其早期识别和干预对于减轻社会与家庭负担、提高患者康复率具有重要意义。传统的抑郁症筛查方法主要依赖自评量表或临床访谈,存在主观性强、耗时长、依从性低等不足,难以满足大规模筛查与持续监测的需求。近年来,语音信号因其非接触、低成本、易获取等优势,逐渐成为心理健康评估的重要生物标志物,在临床辅助诊断与日常健康管理中具有广阔的应用前景。
2、在语音信号处理领域,mel频谱(mel spectrogram)是一种常用的时-频表示方法,通过模拟人耳对不同频率的非线性感知特性,将语音信号映射到与人类听觉感知一致的频率尺度,能够有效保留语音的声学细节特征。现有抑郁语音分析方法中,mel频谱已被广泛用于深度学习模型的输入,以捕捉与心理状态相关的频率模式和能量分布变化。研究表明,抑郁状态个体在mel频谱上往往呈现出特定的异常模式,例如语速减慢导致的频谱局部能量延长、频繁犹豫停顿造成的能量
...【技术保护点】
1.一种基于语音多尺度时域感知的抑郁状态预测方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于语音多尺度时域感知的抑郁状态预测方法,其特征在于,步骤S1所述采集参与者朗读统一标准化文本的语音信号,并进行预处理;具体为:
3.根据权利要求2所述的基于语音多尺度时域感知的抑郁状态预测方法,其特征在于,步骤S2所述将预处理后的语音信号按固定时长切分为多个不重叠语音段,以各段语音段分别生成对应的Mel频谱图;具体为:
4.根据权利要求1所述的基于语音多尺度时域感知的抑郁状态预测方法,其特征在于,步骤S3中利用卷积网络从所述Mel
...【技术特征摘要】
1.一种基于语音多尺度时域感知的抑郁状态预测方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于语音多尺度时域感知的抑郁状态预测方法,其特征在于,步骤s1所述采集参与者朗读统一标准化文本的语音信号,并进行预处理;具体为:
3.根据权利要求2所述的基于语音多尺度时域感知的抑郁状态预测方法,其特征在于,步骤s2所述将预处理后的语音信号按固定时长切分为多个不重叠语音段,以各段语音段分别生成对应的mel频谱图;具体为:
4.根据权利要求1所述的基于语音多尺度时域感知的抑郁状态预测方法,其特征在于,步骤s3中利用卷积网络从所述mel频谱图提取时间上下文特征,具体为:
5.根据权利要求4所述的基于语音多尺度时域感知的抑郁状态预测方法,其特征在于,步骤s3中将时间上下文特征划分为若干个非重叠窗口,引入注意力机制,在窗口内并行计算频谱与时间两个维度的注意力,建模频谱与时间依赖关系,生成联合特征;具体为:
6.根据权利要求4所述的基于语音多尺度时域感知的抑郁状态预测方法,...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。