音乐情感识别方法、装置、计算机设备及计算机存储介质制造方法及图纸

技术编号:20007152 阅读:30 留言:0更新日期:2019-01-05 18:42
本申请公开了一种音乐情感识别方法、装置、计算机设备及计算机存储介质,涉及人工智能技术领域,可以提高音乐情感识别精度。所述方法包括:从音频样本数据中提取音频特征数据;将所述音频特征数据输入至卷积神经网络进行训练,得到情感分类模型;通过所述情感分类模型将音频特征数据分类为各个情感维度的局部平移不变特征;将所述不同情感维度的局部平移不变特征输入至递归神经网络中进行训练,得到音乐情感识别模型,所述音乐情感识别模型中记录有局部平移不变特征在各个情感维度上的音乐情感识别结果;通过所述音乐情感识别模型对待识别音频数据进行音乐情感识别,得到各个情感维度上的音乐情感识别结果。

Music Emotion Recognition Method, Device, Computer Equipment and Computer Storage Media

The application discloses a music emotion recognition method, device, computer equipment and computer storage medium, which relates to the field of artificial intelligence technology and can improve the accuracy of music emotion recognition. The method includes: extracting audio feature data from audio sample data; inputting the audio feature data into convolutional neural network for training to obtain emotional classification model; classifying audio feature data into local translation invariant features of each emotional dimension through the emotional classification model; and inputting the local translation invariant features of the different emotional dimensions into recursive spirit. After training in the network, the music emotion recognition model is obtained. The music emotion recognition model records the music emotion recognition results of the local translation invariant features on each emotional dimension. The music emotion recognition results on each emotional dimension are obtained by using the music emotion recognition model to treat the identified audio data.

【技术实现步骤摘要】
音乐情感识别方法、装置、计算机设备及计算机存储介质
本专利技术涉及人工智能
,尤其是涉及到音乐情感识别方法、装置、计算机设备及计算机存储介质。
技术介绍
音乐一直以来都是表达、传递情感的一种方式。情感的表达是音乐的本质特征,不仅能够体现作曲家的意念,也可以使聆听者产生相应的情绪变化。因此音乐情感的识别对音乐检索、音乐合成以及音乐治疗技术中有着重要意义。在音乐信号处理中,音乐对情感的感知或诱导是属于与音乐内容相关的音乐属性,也是音乐分类的一种方法。为了实现音乐情感识别,需要根据某些特征标准确定一个合理有效的情感分类模型,通过情感分类模型进一步识别音乐情感。现有的情感识别方式主要有两种,一种是通过人工试听识别并分类标注,而对于情感的分类更多的取决于主观感受,这一过程会受到许多外在因素的影响,如听音人的文化背景、性格爱好、甚至听音时的天气以及环境都会使听音者对同一首歌有不同的情感体验,人工标注耗时耗力且不够精确,使得音乐情感分类标注的成本较高;另一种是采用支持向量机分类器对音乐情感进行识别分类,而支持向量机分类器通常针对少量的训练集才有较好的效果,并且经典支持向量机只有二分类算法,使得音乐情感识别精度较低。
技术实现思路
本专利技术实施例提供了音乐情感识别方法、装置、计算机设备及计算机存储介质,解决了相关技术中音乐情感识别精度较低的问题。根据本专利技术实施例的第一方面,提供一种音乐情感识别方法,所述方法包括:从音频样本数据中提取音频特征数据,所述音频特征数据携带有各个情感维度标注值;将所述音频特征数据输入至卷积神经网络进行训练,得到情感分类模型,所述情感分类模型用于从音频数据中提取出各个情感维度的局部平移不变特征;通过所述情感分类模型将音频特征数据分类为各个情感维度的局部平移不变特征;将所述各个情感维度的局部平移不变特征输入至递归神经网络中进行训练,得到音乐情感识别模型,所述音乐情感识别模型用于识别音频数据在各个情感维度上的音乐情感识别结果;通过所述音乐情感识别模型对待识别音频数据进行音乐情感识别,得到各个情感维度上的音乐情感识别结果。进一步地,在所述从音频样本数据中提取音频特征数据之前,所述方法还包括:按照预设时间间隔对所述音频样本数据进行分段,得到多段分段音频样本数据;获取对每段分段音频样本数据所属情感维度的标注值,得到多段携带各个情感维度标注值的分段音频样本数据。进一步地,所述卷积神经网络为多层结构的网络模型,所述将所述音频特征数据输入至卷积神经网络进行训练,得到情感分类模型包括:通过所述卷积神经网络的卷积层提取所述音频特征数据中各个情感维度的局部音频特征信息;通过所述卷积神经网络的全连接层汇总所述各个情感维度的局部音频特征信息,得到多维度的局部音频特征信息;通过所述卷积神经网络的池化层对所述多维度的局部音频特征信息进行降维处理,得到各个情感维度的局部平移不变特征;通过所述卷积神经网络的分类层对所述各个情感维度的局部平移不变特征进行分类,得到情感分类模型。进一步地,所述递归神经网络为多层结构的网络模型,所述将所述各个情感维度的局部平移不变特征输入至递归神经网络中进行训练,得到音乐情感识别模型包括:通过所述递归神经网络的全连接层汇总所述各个情感维度的局部平移不变特征,得到多维度的局部平移不变特征;通过所述递归神经网络的隐含层根据音频特征数据所携带的各个情感维度标注值来优化所述多维度的局部平移不变特征在各个情感维度上的权重参数;通过所述递归神经网络的输出层根据所述多维度的局部平移不变特征在各个情感维度上的权重参数,计算音频数据在各个情感维度上的情感识别结果,构建音乐情感识别模型。进一步地,所述递归神经网络的隐含层内设置有双向门控循环单元,所述通过所述递归神经网络的隐含层根据音频特征数据所携带的各个情感维度标注值来优化所述多维度的局部平移不变特征在各个情感维度上的权重参数包括:通过所述双向门控循环单元学习多维度的局部平移不变特征中的时间信息,并根据所述时间信息训练所述多维度的局部平移不变特征在各个情感维度上的权重参数;根据所述音频特征数据所携带的各个情感维度标注值来优化所述多维度的局部平移不变特征在各个情感维度上的权重参数。进一步地,在根据所述音乐情感识别模型对待识别音频数据进行音乐情感识别,得到音乐情感识别结果之后,所述方法还包括:根据所述多段携带各个音乐情感维度标注值的分段音频样本数据与音乐情感识别结果,计算所述音乐情感识别模型的均方根误差;将所述音乐情感识别模型的均方根误差作为衡量所述音乐情感识别模型的统计矩阵,对所述音乐情感识别结果进行校验。进一步地,在所述将所述音乐情感识别模型的均方根误差作为衡量所述音乐情感识别模型的统计矩阵,对所述音乐情感识别结果进行校验之后,所述方法还包括:将所述音乐情感识别模型的均方根误差作为损失函数反馈至所述递归神经网络模型的隐含层,对所述隐含层的权重参数进行更新。根据本专利技术实施例的第二方面,提供一种音乐情感识别装置,所述装置包括:提取单元,用于从音频样本数据中提取音频特征数据;第一训练单元,用于将所述音频特征数据输入至卷积神经网络进行训练,得到情感分类模型,所述情感分类模型用于从音频数据中提取出各个情感维度的局部平移不变特征;分类单元,用于通过所述情感分类模型将音频特征数据分类为各个情感维度的局部平移不变特征;第二训练单元,用于将所述各个情感维度的局部平移不变特征输入至递归神经网络中进行训练,得到音乐情感识别模型,所述音乐情感识别模型用于识别音频数据在各个情感维度上的音乐情感识别结果;识别单元,用于通过所述音乐情感识别模型对待识别音频数据进行音乐情感识别,得到各个情感维度上的音乐情感识别结果。进一步地,所述装置还包括:分段单元,用于在所述从音频样本数据中提取音频特征数据之前,按照预设时间间隔对所述音频样本数据进行分段,得到多段音频样本数据;标注单元,用于获取对每段分段音频样本数据所属情感维度的标注值,得到多段携带各个情感维度标注值的分段音频样本数据。进一步地,所述卷积神经网络为多层结构的网络模型,所述第一训练单元包括:卷积模块,用于通过所述卷积神经网络的卷积层提取所述音频特征数据中各个情感维度的局部音频特征信息;第一整合模块,用于通过所述卷积神经网络的全连接层汇总所述各个情感维度的局部音频特征信息,得到多维度的局部音频特征信息;降维模块,用于通过所述卷积神经网络的池化层对所述多维度的局部音频特征信息进行降维处理,得到各个情感维度的局部平移不变特征;分类模块,用于通过所述卷积神经网络的分类层对所述各个情感维度的局部平移不变特征进行分类,得到情感分类模型。进一步地,所述递归神经网络为多层结构的网络模型,所述第二训练单元包括:第二整合模块,用于通过所述递归神经网络的全连接层汇总所述各个情感维度的局部平移不变特征,得到多维度的局部平移不变特征;训练模块,用于通过所述递归神经网络的隐含层根据音频特征数据所携带的各个情感维度标注值来优化所述多维度的局部平移不变特征在各个情感维度上的权重参数;构建模块,用于通过所述递归神经网络的输出层根据所述多维度的局部平移不变特征在各个情感维度上的权重参数,计算音频数据在各个情感维度上的情感识别结果,构建音乐情感识别模型。进一步地,所述递归神经本文档来自技高网...

【技术保护点】
1.一种音乐情感识别方法,其特征在于,所述方法包括:从音频样本数据中提取音频特征数据,所述音频特征数据携带有各个情感维度标注值;将所述音频特征数据输入至卷积神经网络进行训练,得到情感分类模型,所述情感分类模型用于从音频数据中提取出各个情感维度的局部平移不变特征;通过所述情感分类模型将音频特征数据分类为各个情感维度的局部平移不变特征;将所述各个情感维度的局部平移不变特征输入至递归神经网络中进行训练,得到音乐情感识别模型,所述音乐情感识别模型用于识别音频数据在各个情感维度上的音乐情感识别结果;通过所述音乐情感识别模型对待识别音频数据进行音乐情感识别,得到各个情感维度上的音乐情感识别结果。

【技术特征摘要】
1.一种音乐情感识别方法,其特征在于,所述方法包括:从音频样本数据中提取音频特征数据,所述音频特征数据携带有各个情感维度标注值;将所述音频特征数据输入至卷积神经网络进行训练,得到情感分类模型,所述情感分类模型用于从音频数据中提取出各个情感维度的局部平移不变特征;通过所述情感分类模型将音频特征数据分类为各个情感维度的局部平移不变特征;将所述各个情感维度的局部平移不变特征输入至递归神经网络中进行训练,得到音乐情感识别模型,所述音乐情感识别模型用于识别音频数据在各个情感维度上的音乐情感识别结果;通过所述音乐情感识别模型对待识别音频数据进行音乐情感识别,得到各个情感维度上的音乐情感识别结果。2.根据权利要求1所述的方法,其特征在于,在所述从音频样本数据中提取音频特征数据之前,所述方法还包括:按照预设时间间隔对所述音频样本数据进行分段,得到多段分段音频样本数据;获取对每段分段音频样本数据所属情感维度的标注值,得到多段携带各个情感维度标注值的分段音频样本数据。3.根据权利要求1所述的方法,其特征在于,所述卷积神经网络为多层结构的网络模型,所述将所述音频特征数据输入至卷积神经网络进行训练,得到情感分类模型包括:通过所述卷积神经网络的卷积层提取所述音频特征数据中各个情感维度的局部音频特征信息;通过所述卷积神经网络的全连接层汇总所述各个情感维度的局部音频特征信息,得到多维度的局部音频特征信息;通过所述卷积神经网络的池化层对所述多维度的局部音频特征信息进行降维处理,得到各个情感维度的局部平移不变特征;通过所述卷积神经网络的分类层对所述各个情感维度的局部平移不变特征进行分类,得到情感分类模型。4.根据权利要求1所述的方法,其特征在于,所述递归神经网络为多层结构的网络模型,所述将所述各个情感维度的局部平移不变特征输入至递归神经网络中进行训练,得到音乐情感识别模型包括:通过所述递归神经网络的全连接层汇总所述各个情感维度的局部平移不变特征,得到多维度的局部平移不变特征;通过所述递归神经网络的隐含层根据音频特征数据所携带的各个情感维度标注值来优化所述多维度的局部平移不变特征在各个情感维度上的权重参数;通过所述递归神经网络的输出层根据所述多维度的局部平移不变特征在各个情感维度上的权重参数,构建用于识别音频数据在各个情感维度上的音乐情感识别模型。5.根据权利要求4所述的方法,其特征在于,所述递归神经网络的隐含...

【专利技术属性】
技术研发人员:梅亚琦刘奡智王义文王健宗肖京
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1