基于深度语音分析和层次递进结构的语音情感识别方法技术

技术编号:42370920 阅读:47 留言:0更新日期:2024-08-16 14:53
本发明专利技术提供一种基于深度语音分析和层次递进结构的语音情感识别方法。该方法通过五折交叉验证将语音情感数据集划分为训练集和测试集,并设计了HCE特征提取器,包括卷积神经网络编码器、Transformer编码器和卷积模块,用于深度语音分析和提取时域与频域特征,有效提取语音的潜在自然特征。通过引入时域融合卷积模块解决了提取局部特征的问题。层次递进结构TFC‑SpeechFormer网络模型的构建,将语音处理分为结构、音素、单词和句子阶段,逐步提高对语音信号的抽象理解,减少冗余信息,提高可解释性。通过训练和调整确保模型在数据集上的性能稳定和可靠。本发明专利技术在语音情感识别方面取得显著进展,提高了准确率,使其更适用于实际应用场景。

【技术实现步骤摘要】

本专利技术涉及计算机语音识别,具体为一种基于深度语音分析和层次递进结构实现的高效语音情感识别方法。


技术介绍

1、情感在人类的生活和进化中扮演着关键角色。语音情感识别作为一项新兴技术,在广泛应用中展现出巨大潜力,特别是在当代工作压力不断增大的环境下,对抑郁症等情感相关问题的关注逐渐凸显。语音情感识别旨在通过分析用户的语音情感,及时识别与抑郁症相关的情感体验,从而实现早期干预和预防的目标。

2、尽管语音情感识别取得了显著进展,但当前研究主要专注于深层高效的情感识别。随着人工智能和机器学习技术的飞速发展,研究者们在传统语音情感识别方面主要关注构建具有长程依赖关系的全局上下文模型,以提高识别准确率。然而,在研究中存在对语音潜在自然特性的忽略。例如,即使一个人不懂俄语,仍能通过语气、音调、长音等来判断说话者的俄语情感。提取细粒度的局部特征的能力较差,导致语音特有的结构不够完善。虽然可以通过卷积逐层传递捕获局部上下文信息,但自注意力或卷积模型都有自身的局限性,可能需要更多层或参数以获取全局信息。对于较长的输入序列和更深的模型,需要在整合语音的整体特性方面本文档来自技高网...

【技术保护点】

1.一种基于深度语音分析和层次递进结构的语音情感识别方法,步骤包括:

2.根据权利要求1所述的基于深度语音分析和层次递进结构的语音情感识别方法,其特征在于,步骤S2具体包括:

3.根据权利要求2所述的基于深度语音分析和层次递进结构的语音情感识别方法,其特征在于,步骤S3具体包括:

4.根据权利要求3所述的基于深度语音分析和层次递进结构的语音情感识别方法,其特征在于,步骤S4具体包括:

5.根据权利要求4所述的基于深度语音分析和层次递进结构的语音情感识别方法,其特征在于,步骤S5具体包括:

6.根据权利要求5所述的基于深度语音分析...

【技术特征摘要】

1.一种基于深度语音分析和层次递进结构的语音情感识别方法,步骤包括:

2.根据权利要求1所述的基于深度语音分析和层次递进结构的语音情感识别方法,其特征在于,步骤s2具体包括:

3.根据权利要求2所述的基于深度语音分析和层次递进结构的语音情感识别方法,其特征在于,步骤s3具体包括:

4.根据权利要求3所述的基于深度语音分析和...

【专利技术属性】
技术研发人员:魏巍张秉堃
申请(专利权)人:大连民族大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1