The application discloses a music emotion recognition method, device, computer equipment and computer storage medium, which relates to the field of artificial intelligence technology and can improve the accuracy of music emotion recognition. The method includes: extracting audio feature data from audio sample data; inputting the audio feature data into convolutional neural network for training to obtain emotional classification model; classifying audio feature data into local translation invariant features of each emotional dimension through the emotional classification model; and inputting the local translation invariant features of the different emotional dimensions into recursive spirit. After training in the network, the music emotion recognition model is obtained. The music emotion recognition model records the music emotion recognition results of the local translation invariant features on each emotional dimension. The music emotion recognition results on each emotional dimension are obtained by using the music emotion recognition model to treat the identified audio data.
【技术实现步骤摘要】
音乐情感识别方法、装置、计算机设备及计算机存储介质
本专利技术涉及人工智能
,尤其是涉及到音乐情感识别方法、装置、计算机设备及计算机存储介质。
技术介绍
音乐一直以来都是表达、传递情感的一种方式。情感的表达是音乐的本质特征,不仅能够体现作曲家的意念,也可以使聆听者产生相应的情绪变化。因此音乐情感的识别对音乐检索、音乐合成以及音乐治疗技术中有着重要意义。在音乐信号处理中,音乐对情感的感知或诱导是属于与音乐内容相关的音乐属性,也是音乐分类的一种方法。为了实现音乐情感识别,需要根据某些特征标准确定一个合理有效的情感分类模型,通过情感分类模型进一步识别音乐情感。现有的情感识别方式主要有两种,一种是通过人工试听识别并分类标注,而对于情感的分类更多的取决于主观感受,这一过程会受到许多外在因素的影响,如听音人的文化背景、性格爱好、甚至听音时的天气以及环境都会使听音者对同一首歌有不同的情感体验,人工标注耗时耗力且不够精确,使得音乐情感分类标注的成本较高;另一种是采用支持向量机分类器对音乐情感进行识别分类,而支持向量机分类器通常针对少量的训练集才有较好的效果,并且经典支持向量机只有二分类算法,使得音乐情感识别精度较低。
技术实现思路
本专利技术实施例提供了音乐情感识别方法、装置、计算机设备及计算机存储介质,解决了相关技术中音乐情感识别精度较低的问题。根据本专利技术实施例的第一方面,提供一种音乐情感识别方法,所述方法包括:从音频样本数据中提取音频特征数据,所述音频特征数据携带有各个情感维度标注值;将所述音频特征数据输入至卷积神经网络进行训练,得到情感分类模型,所述情感分类模 ...
【技术保护点】
1.一种音乐情感识别方法,其特征在于,所述方法包括:从音频样本数据中提取音频特征数据,所述音频特征数据携带有各个情感维度标注值;将所述音频特征数据输入至卷积神经网络进行训练,得到情感分类模型,所述情感分类模型用于从音频数据中提取出各个情感维度的局部平移不变特征;通过所述情感分类模型将音频特征数据分类为各个情感维度的局部平移不变特征;将所述各个情感维度的局部平移不变特征输入至递归神经网络中进行训练,得到音乐情感识别模型,所述音乐情感识别模型用于识别音频数据在各个情感维度上的音乐情感识别结果;通过所述音乐情感识别模型对待识别音频数据进行音乐情感识别,得到各个情感维度上的音乐情感识别结果。
【技术特征摘要】
1.一种音乐情感识别方法,其特征在于,所述方法包括:从音频样本数据中提取音频特征数据,所述音频特征数据携带有各个情感维度标注值;将所述音频特征数据输入至卷积神经网络进行训练,得到情感分类模型,所述情感分类模型用于从音频数据中提取出各个情感维度的局部平移不变特征;通过所述情感分类模型将音频特征数据分类为各个情感维度的局部平移不变特征;将所述各个情感维度的局部平移不变特征输入至递归神经网络中进行训练,得到音乐情感识别模型,所述音乐情感识别模型用于识别音频数据在各个情感维度上的音乐情感识别结果;通过所述音乐情感识别模型对待识别音频数据进行音乐情感识别,得到各个情感维度上的音乐情感识别结果。2.根据权利要求1所述的方法,其特征在于,在所述从音频样本数据中提取音频特征数据之前,所述方法还包括:按照预设时间间隔对所述音频样本数据进行分段,得到多段分段音频样本数据;获取对每段分段音频样本数据所属情感维度的标注值,得到多段携带各个情感维度标注值的分段音频样本数据。3.根据权利要求1所述的方法,其特征在于,所述卷积神经网络为多层结构的网络模型,所述将所述音频特征数据输入至卷积神经网络进行训练,得到情感分类模型包括:通过所述卷积神经网络的卷积层提取所述音频特征数据中各个情感维度的局部音频特征信息;通过所述卷积神经网络的全连接层汇总所述各个情感维度的局部音频特征信息,得到多维度的局部音频特征信息;通过所述卷积神经网络的池化层对所述多维度的局部音频特征信息进行降维处理,得到各个情感维度的局部平移不变特征;通过所述卷积神经网络的分类层对所述各个情感维度的局部平移不变特征进行分类,得到情感分类模型。4.根据权利要求1所述的方法,其特征在于,所述递归神经网络为多层结构的网络模型,所述将所述各个情感维度的局部平移不变特征输入至递归神经网络中进行训练,得到音乐情感识别模型包括:通过所述递归神经网络的全连接层汇总所述各个情感维度的局部平移不变特征,得到多维度的局部平移不变特征;通过所述递归神经网络的隐含层根据音频特征数据所携带的各个情感维度标注值来优化所述多维度的局部平移不变特征在各个情感维度上的权重参数;通过所述递归神经网络的输出层根据所述多维度的局部平移不变特征在各个情感维度上的权重参数,构建用于识别音频数据在各个情感维度上的音乐情感识别模型。5.根据权利要求4所述的方法,其特征在于,所述递归神经网络的隐含...
【专利技术属性】
技术研发人员:梅亚琦,刘奡智,王义文,王健宗,肖京,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。