An emotion synthesis and classification method for popular songs involves the field of audio information processing. Firstly, distinguish the emergence pattern of a music chorus to determine different pop music patterns; secondly, use a flexible segmentation method to divide a song into N segments, and predict the pleasure and intensity of each segment; according to the pattern of a pop music and the pleasure and intensity of N segments of music. As a result, different classifiers were used to synthesize the emotion of the whole music, and the emotion label of the whole music was obtained. The advantage of this method is to extract V/A emotional evolutionary features by using flexible segmentation technology and deal with them separately, so that the training of emotional classifiers for pop songs with different structures can be more targeted; the emotional classification of pop songs can be carried out by using pop songs'structure and emotional evolutionary features, and the statistical characteristics based on the whole song can be summarized. The method of combination can better reflect the emotional cognition process and characteristics of human beings.
【技术实现步骤摘要】
一种流行歌曲情感综合与分类方法
本专利技术涉及音频信息处理领域的一种面向全曲的自动流行音乐情感分类方法.
技术介绍
当前针对歌曲情感分类的方法的研究对象多为处理歌曲中的一个片段,一个基本的思路是将片段划分为定长的帧,对帧直接进行情感分类然后统计歌曲片段中占主导地位的情感类型做为歌曲片段的情感类型标签。也有采用帧袋[2]的方式建模,再基于帧袋进行整段歌曲进行分类的,但这些方法没有考虑在欣赏歌曲时人类情感响应的内在特点。实际上,人们对整首歌曲的情感感知受到情感表现在歌曲不同位置出现的影响,也受到情感表现发展过程的影响,传统的帧袋特征忽略了这些因素。人们还提出了采用副歌为代表段进行歌曲情感分类的方案[3],但没有给出根据不同段落进行情感综合的方法。本专利技术基于歌曲结构规律表现和听众音乐情感识别过程的观察和分析,设计一种二阶段情感综合与分类方法来判别整首歌曲的情感标签。本专利技术的歌曲情感综合方法设计主要依据如下观察:一、歌曲情感表现在一定时间段内是稳定的;二、歌曲的不同段落对歌曲整体的情感表达贡献度是不同的,其情感演化对整首音乐的情感认知是有影响的;三、大部分歌曲的结构是遵从一定规律,也就是前奏、尾奏、副歌、主歌等的出现在歌曲的相对位置上遵从一定的规律,尽管可能有例外和不是十分严格。
技术实现思路
本专利技术给出一种对流行音乐进行自动歌曲情感综合与分类的技术方案。歌曲情感综合与分类分两阶段,首先,对一首音乐进行音乐副歌出现模式判别,确定不同的流行音乐模式;其次采用一种柔性分段方法将一首歌曲分为N个片段(N的大小与歌曲副歌出现的次数相关),对每一个片段预测其愉悦度与 ...
【技术保护点】
1.一种流行歌曲情感综合与分类方法,其特征在于分两阶段,首先,对一首音乐进行音乐副歌出现模式判别,确定不同的流行音乐模式;其次采用一种柔性分段方法将一首歌曲分为N个片段,对每一个片段预测其愉悦度与激烈度;其次,依据一首流行音乐的模式和N个音乐片段的愉悦度和激烈度结果,选用不同的分类器,进行整首音乐情感综合,得出整首音乐的情感标签。
【技术特征摘要】
1.一种流行歌曲情感综合与分类方法,其特征在于分两阶段,首先,对一首音乐进行音乐副歌出现模式判别,确定不同的流行音乐模式;其次采用一种柔性分段方法将一首歌曲分为N个片段,对每一个片段预测其愉悦度与激烈度;其次,依据一首流行音乐的模式和N个音乐片段的愉悦度和激烈度结果,选用不同的分类器,进行整首音乐情感综合,得出整首音乐的情感标签。2.根据权利要求1所述的方法,其特征在于,对一首歌的音乐片段的激烈度和愉悦度预测,形成歌曲情感演化序列。采用副歌识别算法进行副歌识别,副歌识别后,一首歌曲将呈现其它段,副歌,其它段,副歌交替出现的模式,其中其它段包括前奏,主歌,桥段或其组合。根据副歌出现的重复模式将流行歌曲分为k类,分为无副歌结构,2次副歌出现,3次副歌出现,...,k次副歌出现结构,取k不大于5.如果歌曲模式识别器识别出副歌出现次数大于5,令k=5,将其归为与k=5的歌曲一类,并在后续处理中略掉第六次副歌出现及其后面的音乐内容。在流行音乐歌曲模式检测完成后,如果检测到副歌,会得到各段副歌的起止时间。然后采用一种柔性分段策略对歌曲进行分段,将一首完整的歌曲分为N个片段。每个片段的时长应不大于10s。设计的柔性分段方案如下:第一类为无重复副歌结构。对于无重复副歌结构,将歌曲等分为N=N1=40个片段。假定流行歌曲的长度一般不大于400s.如果大于400s,将进行离散采样,等间距取出N1个10s的片段。对于歌曲长度L<400s的歌曲,片段长度Lc=L/N。第二类为二次重复结构。对于二次重复结构OCOC,其中C代表副歌片段,O代表其他类别片段,将其它段与副歌段进行等数量分段。每个其它段O和每个副歌段C都分为M个小片段,每个小片段长度不大于10s,如果大于10s,进行10s片段的等距离采样。歌曲总共分为N=N2=4M个片段,其中M为正整数,建议取10。第三类为三次重复结构。对于三次重复结构OCOCOC,将其它段与副歌段进行等数量分段。每个其它段O和每个副歌段C都分为M个小片段,每个小片段长度不大于10s,如果大于10s,进行10s片段的等距离采样。歌曲总共分为N=N3=6M个片段,其中M为正整数,建议取7。第四类为四次重复结构,第五类为5次及以上重复结构。对于4次重复结构OCOCOCOC,和5以上次重复结构,分段方法与前面的重复结构类似,相应分为N=N4=8M和N=N5=10M段,M分别建议取5和4。3.根据权利要求1所述的方法,其特征在于,基于音乐有序片段的情感数据集训练音乐片段情感预测器。音乐片段情感的预测中采用Thayer的Valence-Arousal(V-A)模型来表示情感,分为愉悦度(valence)和激烈度(arousal)两个维度。愉悦度表示情感的正面和负面属性,激烈度指示情感的强烈程度(intensity)。音乐情感表示为激烈度和愉悦度指数<v,a>,v,a的取值范围为[-1,+1]之间的实数。面向音乐片段的情感预测模型是由具有稳定情感表达的音乐片段经训练所得,称之为V/A预测器,是由音乐片段声学特征到V/A值的一个映射,其一般表示如式1,2,具体根据实施时选择的分类器而有所不同。V=fV(x1,x2,…,xi,…,xn)(1)A=fA(x1,x2,…,xi,…,xn)(2)其中xi(i=1,...,n)为音乐片段的第i个声学特征值,n为进行V/A值预测式选取的音乐声学特征数量。对于每一首歌曲,经过分片情感预测,...
【专利技术属性】
技术研发人员:孙书韬,王永滨,曹轶臻,王琦,赵庄言,
申请(专利权)人:中国传媒大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。