The invention provides a spectrum and deep convolutional neural network method of speech emotion recognition, which comprises the following steps: according to the generated speech signal spectrum diagram; constructing deep convolutional neural network model; with large spectrum as input, training and optimizing the deep convolutional neural network model to test the trained; the deep convolutional neural network model and optimization. The invention uses a new speech emotion recognition method to transform the speech signal processing into image processing, and can effectively improve the recognition ability by combining the CNN.
【技术实现步骤摘要】
一种使用谱图和深卷积神经网络进行语音情感识别的方法
本专利技术涉及语音信号处理和模式识别的
,特别是一种使用谱图和深卷积神经网络进行语音情感识别的方法。
技术介绍
随着信息技术的不断发展,社会发展对情感计算提出了更高的要求。例如在人机交互方面,一个拥有情感能力的计算机能够对人类情感进行获取、分类、识别和响应,进而帮助使用者获得高效而又亲切的感觉,并能有效减轻人们使用电脑的挫败感,甚至能帮助人们理解自己和他人的情感世界。例如采用此类技术探测驾驶司机的精力是否集中、感受到的压力水平等,并做出相应反应。此外,情感计算还能应用在机器人、智能玩具、游戏、电子商务等相关产业中,以构筑更加拟人化的风格和更加逼真的场景。情感也反映了人类的心理健康情况,情感计算的应用可以有效地帮助人们避免不良情绪,保持乐观健康的心理。现有技术分类不够准确。直接对声音进行提取特征会受声音中的噪音影响较大。公开号为CN106782602A的专利文件公开了一种基于长短时间记忆网络和卷积神经网络的语音情感识别方法,该方法构建基于LSTM和CNN的语音情感识别系统,将语音序列作为系统的输入,采用反向传 ...
【技术保护点】
一种使用谱图和深卷积神经网络进行语音情感识别的方法,包括以下步骤:步骤1:根据语音信号生成频谱图;步骤2:构建深卷积神经网络模型;步骤3:用大量的频谱图作为输入,训练并优化所述深卷积神经网络模型;步骤4:对训练好的所述深卷积神经网络模型进行测试并优化。
【技术特征摘要】
1.一种使用谱图和深卷积神经网络进行语音情感识别的方法,包括以下步骤:步骤1:根据语音信号生成频谱图;步骤2:构建深卷积神经网络模型;步骤3:用大量的频谱图作为输入,训练并优化所述深卷积神经网络模型;步骤4:对训练好的所述深卷积神经网络模型进行测试并优化。2.如权利要求1所述的使用谱图和深卷积神经网络进行语音情感识别的方法,其特征在于:所述频谱图是语音信号的特定波形的频率随时间变化的视觉表现。3.如权利要求2所述的使用谱图和深卷积神经网络进行语音情感识别的方法,其特征在于:所述频谱图是一个二位图形,横坐标表示时间,纵坐标表示频率。4.如权利要求3所述的使用谱图和深卷积神经网络进行语音情感识别的方法,其特征在于:所述频谱图是指对所述语音信号加入FFT转换计算得到时间和频率的关系。5.如权利要求4所述的使用谱图和深卷积神经网络进行语音情感识别的方法,其特征在于:为了观察所述语音信号某一时刻的频率,将所述语音信号分成多个块,每一块都进行FFT转换。6.如权利要求5所述...
【专利技术属性】
技术研发人员:袁家政,刘宏哲,龚灵杰,
申请(专利权)人:北京联合大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。