一种基于卷积神经网络的语音情感识别方法技术

技术编号：33926786 阅读：34 留言：0更新日期：2022-06-25 21:51

本发明专利技术属于语音情感识别领域，具体公开了一种基于卷积神经网络的语音情感识别方法，包括以下步骤：S1：对语音数据库中的语音样本进行预处理操作，从而得到每一段语音样本的语谱图，在语谱图中X轴为时间、Y轴为频率、Z轴为幅度，其中幅度用亮色表示，颜色越深则幅度越低；通过语谱图可以查看指定频率端的能量分布；S2：建立卷积神经网络模型，利用语音数据库对建立的卷积神经网络进行训练；本发明专利技术通过建立卷积神经网络模型处理语音信号，能够对语音信号进行特征提取，从而分析出语音信号的情感类型，不仅极大地提高了识别的准确度，还能够减少大量的分析时间，解决了现有技术中语音特征提取困难、运算困难的问题。运算困难的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于卷积神经网络的语音情感识别方法

[0001]本专利技术涉及语音情感识别领域，具体为一种基于卷积神经网络的语音情感识别方法。

技术介绍

[0002]自然和谐的人机交互中，机器应该能理解人的情感和意图，对不同人、不同环境、不同任务都能给予不同的反馈，那么机器如果能拥有像人与人一样可以方便与人自然交流的“能力”，就必须要解决如何更好理解交流中的情感问题，而这正是“情感智能(EmotionalIntelligence)”所需要解决的，情感智能可以理解为情感的准确识别和反馈能力。
[0003]目前，应用于人类情感识别研究的检测信息包括语音、面部表情、生理信号、肢体语言等。语音信号是人与人之间沟通最快且最自然的方法，语音情感识别研究对促进和谐人机交互意义重大。
[0004]语音情感由一些语音参数表征，然而这些特征参数内在的复杂性决定了情感特征提取的困难。国内外研究者们从语音学和也理学方面对情感特征进行了大量的研究。一般提取的情感特征主要分为韵律特征、音质特征和谱特征。韵律特征被认为是主要的语音情感参数，反映的是"唤醒度"信息。人类语言的时常、语调、轻重各不相同，这些韵律特征的变化构成了美妙的语言。常见韵律特征有基频、时长、能量等，韵律特征的统计特征分析着眼于整体语音,反映出一段时间之上韵律参数的变化规律。在Basque情感数据上，Luengo等人研究发现能量的平均值、方差、能量对数和基频对数的动态变化范围、基频均值和对数斜交共6个特征是最具有情感区分能力的特征。Origlia等人提取基频和能量相关的共31...

【技术保护点】

【技术特征摘要】
1.一种基于卷积神经网络的语音情感识别方法，其特征在于，包括以下步骤：S1：对语音数据库中的语音样本进行预处理操作，从而得到每一段语音样本的语谱图，在语谱图中X轴为时间、Y轴为频率、Z轴为幅度，其中幅度用亮色表示，颜色越深则幅度越低；通过语谱图可以查看指定频率端的能量分布；S2：建立卷积神经网络模型，利用语音数据库对建立的卷积神经网络进行训练；S3：用倒谱系数算法对语谱图进行处理，将每一帧波形变成一个包含声音信息的多维向量；S4：用卷积神经网络模型对包含声音信息的多维向量进行处理，从而提取语音特征，将得到的语音特征进行情感分类，并将卷积神经网络得到的语音特征与语音样本的标签进行核对，在多次训练后，得到优化后的卷积神经网络模型；S5：将待识别的语音信号进行预处理，将得到的语谱图输入至卷积神经网络模型内提取其语音特征，其输出中维数最大的类别即为识别的语音情感。2.根据权利要求1所述的一种基于卷积神经网络的语音情感识别方法，其特征在于：所述预处理操作依次为将首尾端的静音切除、分帧、加窗、傅里叶变换和...

【专利技术属性】
技术研发人员：袁钰娴，
申请(专利权)人：南京小灿灿网络科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人