一种基于特征加权模糊支持向量机的音乐流派分类方法及系统技术方案

技术编号:20623645 阅读:22 留言:0更新日期:2019-03-20 14:55
本发明专利技术涉及一种基于特征加权模糊支持向量机的音乐流派分类方法及系统,属于音乐内容检索及模式识别技术领域。本发明专利技术的分类器选择模糊支持向量机,能够根据不同输入样本对分类贡献的不同,赋以相应隶属度,目的在于能够很好的减少噪声的影响;用reliefF特征选择算法计算出的各特征权重,用于对模糊支持向量机的隶属度的确定方法,考虑到了不同权重的特征对分类影响大小的不同;针对盲区不可分点,用该点到各个类中心的加权欧氏距离进行多类别概率划分,符合当下音乐多元化的实质。

A Music School Classification Method and System Based on Feature Weighted Fuzzy Support Vector Machine

The invention relates to a music genre classification method and system based on feature weighted fuzzy support vector machine, which belongs to the technical field of music content retrieval and pattern recognition. The classifier of the present invention chooses the fuzzy support vector machine, which can assign the corresponding membership degree according to the contribution of different input samples to the classification, so as to reduce the influence of noise. The weight of each feature calculated by reliefF feature selection algorithm is used to determine the membership degree of the fuzzy support vector machine, taking into account the influence of the characteristics of different weights on the classification. Different sizes; aiming at the non-separable points of blind area, the weighted Euclidean distance from the point to the center of each category is used to classify the multi-category probability, which conforms to the essence of current music diversification.

【技术实现步骤摘要】
一种基于特征加权模糊支持向量机的音乐流派分类方法及系统
本专利技术涉及一种基于特征加权模糊支持向量机的音乐流派分类方法及系统,属于音乐内容检索及模式识别

技术介绍
音乐是人们用来表现生活、抒发情感的一种艺术。音乐流派是人类创造的分类标签,由专家们通过一定的相似性将音乐进行组织整理。随着音乐数据的不断增多,越来越庞大的数字音乐数据库需要智能化、自动化的分类管理,音乐流派的分类受到社会和学界越来越广泛的关注。然而,当下音乐的发展趋势越来越多元化,一首音乐作品可能会融入多种流派。音乐流派分类系统有三个组成部分:音乐特征的提取及选择;分类器的选择及模型训练;分类效果测试及对比。国内外研究,主要围绕着新特征的引入以及分类器最优适配选择进行开展。目前,主流的音乐流派分类系统主要集中于音色、节奏、基因频率等音频的声学特征进行提取,且多采用支持向量机(SVM)分类器对音乐流派分类,取得了良好的效果。然而,目前的研究工作,鲜有考虑到音乐流派具有模糊性这一特点,其最终仅输出一个可能性最大的流派,导致音乐流派信息的不完整,不能跟上如今音乐更加多元化的发展趋势。此外,SVM分类器受噪点影响较大的问题,在对音乐流派分类上也没有得到很好的解决。
技术实现思路
本专利技术提供了一种基于特征加权模糊支持向量机的音乐流派分类方法及系统,该专利技术考虑到了不同权重的特征对分类的贡献程度的不同,能够很好的降低噪点影响;对在盲区的不可分点的多类别概率划分,符合当下音乐多元化的实质。本专利技术的技术方案是:一种基于特征加权模糊支持向量机的音乐流派分类方法,包括:特征权重的计算及特征选择步骤,先将原始音乐数据集归一化处理并分为归一化音乐训练集和归一化音乐测试集,然后在归一化音乐训练集上使用reliefF特征选择算法得到各个特征的权重,将特征权重按照从大到小累加直到超过所有特征权重之和的设定比值,将剩余未被累加的特征移除得到最终的音乐训练集和音乐测试集;其中,原始音乐数据集包含类别属性和特征属性;隶属度确定步骤,求出最终的音乐训练集按照类别属性下的各个类中心,并基于音乐训练集里的每个音乐训练样本到所属类的类中心的加权欧式距离来确定每个训练样本的隶属度;分类模型的训练步骤,将最终的音乐训练集按照一类对其余的方式分组,并由隶属度确定步骤得到的各训练样本的隶属度作为各训练样本在构造最优分类面判别式的惩罚系数,对每组分别求出最优分类面,将各组最优分类面合并作为最终的分类模型;音乐流派分类步骤,将最终的音乐测试集代入分类模型,如果音乐测试集中的测试样本落入相应的类别,则输出测试样本所对应的音乐流派类别结果;如果测试集中的测试样本散落在分类模型得出的不可分区域,则该测试样本作为不可分点,针对不可分点,按照其到各个类中心的加权欧氏距离来确定分属于各个类别的类别概率,类别概率低于设定最小类别概率阈值的类别标签被剔除,并将剩余类别类别概率重新百分比计算并按类别概率从大到小排序,以此作为该不可分点的类别概率输出结果;其中,不可分区域为不可让样本落入唯一类别的区域。所述特征权重的计算及特征选择步骤,具体为:原始音乐数据集包含类别属性和特征属性,针对原始音乐数据集的各特征属性分别采用0均值归一化的方法进行归一化、原始音乐数据集的类别属性不变,得到归一化音乐数据集,将归一化音乐数据集按照1:1的比例拆分为归一化音乐训练集和归一化音乐测试集;采用reliefF特征选择算法对归一化音乐训练集进行特征权重计算,得到每一个特征的特征权重;将特征权重按照从大到小排序,依次累加直到超过所有特征权重之和的80%,将剩余特征权重对应的特征在归一化音乐训练集和归一化音乐测试集上移除,得到最终的音乐训练集和音乐测试集。所述隶属度确定步骤,具体为:分别对最终的音乐训练集里的每个类别,求取该类别内所有样本分别在各个特征上的平均值,以此作为该类别的类中心;分别对音乐训练集里的每个类别,求取该类别里各个样本到该类别中心的加权欧氏距离;分别对音乐训练集里的每个类别,取该类别下的最大加权欧式距离作为该类别特征空间超球体半径,将该类别里各个样本到该类别中心的加权欧氏距离与该类别特征空间超球体半径的作除,将数值1与作除的结果作差来确定该类别下各个样本的隶属度。所述分类模型的训练步骤,具体为:先将最终的音乐训练集按照一类对其余的方式分组,假设共有c个类别,第一组把类别1的训练样本定为正样本,其余类别下的训练样本合起来定为负样本,第二组把类别2的训练样本定为正样本,其余类别下的训练样本合起来定为负样本,以此类推共分为c组;采用模糊支持向量机思想,将隶属度确定步骤得到的每个音乐训练样本的隶属度,作为各训练样本在分别构造c个类别的最优分类面判别式的惩罚系数;对每组训练集分别求出该组正类对应的类别的最优分类面,将各组最优分类面合并作为最终的分类模型。所述按照其到各个类中心的加权欧氏距离来确定分属于各个类别的类别概率,具体为:按照计算类别概率;其中表示不可分点x#分属于第k个类别的类别概率,表示不可分点x#到各个类类中心的加权欧式距离的最大值,表示不可分点x#到第k个类类中心Ok的加权欧式距离,表示最小类别概率,c表示类别的个数。一种基于特征加权模糊支持向量机的音乐流派分类系统,包括:特征权重的计算及特征选择装置,用于先将原始音乐数据集归一化处理并分为归一化音乐训练集和归一化音乐测试集,然后在归一化音乐训练集上使用reliefF特征选择算法得到各个特征的权重,将特征权重按照从大到小累加直到超过所有特征权重之和的设定比值,将剩余未被累加的特征移除得到最终的音乐训练集和音乐测试集;其中,原始音乐数据集包含类别属性和特征属性;隶属度确定装置,用于求出最终的音乐训练集按照类别属性下的各个类中心,并基于音乐训练集里的每个音乐训练样本到所属类的类中心的加权欧式距离来确定每个训练样本的隶属度;分类模型的训练装置,用于将最终的音乐训练集按照一类对其余的方式分组,并由隶属度确定装置得到的各训练样本的隶属度作为各训练样本在构造最优分类面判别式的惩罚系数,对每组分别求出最优分类面,将各组最优分类面合并作为最终的分类模型;音乐流派分类装置,用于将最终的音乐测试集代入分类模型,如果音乐测试集中的测试样本落入相应的类别,则输出测试样本所对应的音乐流派类别结果;如果测试集中的测试样本散落在分类模型得出的不可分区域,则该测试样本作为不可分点,针对不可分点,按照其到各个类中心的加权欧氏距离来确定分属于各个类别的类别概率,类别概率低于设定最小类别概率阈值的类别标签被剔除,并将剩余类别类别概率重新百分比计算并按类别概率从大到小排序,以此作为该不可分点的类别概率输出结果;其中,不可分区域为不可让样本落入唯一类别的区域。所述特征权重的计算及特征选择装置,具体用于:原始音乐数据集包含类别属性和特征属性,针对原始音乐数据集的各特征属性分别采用0均值归一化的方法进行归一化、原始音乐数据集的类别属性不变,得到归一化音乐数据集,将归一化音乐数据集按照1:1的比例拆分为归一化音乐训练集和归一化音乐测试集;采用reliefF特征选择算法对归一化音乐训练集进行特征权重计算,得到每一个特征的特征权重;将特征权重按照从大到小排序,依次累加直到超过所有特征权重之和的80%,将剩本文档来自技高网...

【技术保护点】
1.一种基于特征加权模糊支持向量机的音乐流派分类方法,其特征在于:包括:特征权重的计算及特征选择步骤,先将原始音乐数据集归一化处理并分为归一化音乐训练集和归一化音乐测试集,然后在归一化音乐训练集上使用reliefF特征选择算法得到各个特征的权重,将特征权重按照从大到小累加直到超过所有特征权重之和的设定比值,将剩余未被累加的特征移除得到最终的音乐训练集和音乐测试集;其中,原始音乐数据集包含类别属性和特征属性;隶属度确定步骤,求出最终的音乐训练集按照类别属性下的各个类中心,并基于音乐训练集里的每个音乐训练样本到所属类的类中心的加权欧式距离来确定每个训练样本的隶属度;分类模型的训练步骤,将最终的音乐训练集按照一类对其余的方式分组,并由隶属度确定步骤得到的各训练样本的隶属度作为各训练样本在构造最优分类面判别式的惩罚系数,对每组分别求出最优分类面,将各组最优分类面合并作为最终的分类模型;音乐流派分类步骤,将最终的音乐测试集代入分类模型,如果音乐测试集中的测试样本落入相应的类别,则输出测试样本所对应的音乐流派类别结果;如果测试集中的测试样本散落在分类模型得出的不可分区域,则该测试样本作为不可分点,针对不可分点,按照其到各个类中心的加权欧氏距离来确定分属于各个类别的类别概率,类别概率低于设定最小类别概率阈值的类别标签被剔除,并将剩余类别类别概率重新百分比计算并按类别概率从大到小排序,以此作为该不可分点的类别概率输出结果;其中,不可分区域为不可让样本落入唯一类别的区域。...

【技术特征摘要】
1.一种基于特征加权模糊支持向量机的音乐流派分类方法,其特征在于:包括:特征权重的计算及特征选择步骤,先将原始音乐数据集归一化处理并分为归一化音乐训练集和归一化音乐测试集,然后在归一化音乐训练集上使用reliefF特征选择算法得到各个特征的权重,将特征权重按照从大到小累加直到超过所有特征权重之和的设定比值,将剩余未被累加的特征移除得到最终的音乐训练集和音乐测试集;其中,原始音乐数据集包含类别属性和特征属性;隶属度确定步骤,求出最终的音乐训练集按照类别属性下的各个类中心,并基于音乐训练集里的每个音乐训练样本到所属类的类中心的加权欧式距离来确定每个训练样本的隶属度;分类模型的训练步骤,将最终的音乐训练集按照一类对其余的方式分组,并由隶属度确定步骤得到的各训练样本的隶属度作为各训练样本在构造最优分类面判别式的惩罚系数,对每组分别求出最优分类面,将各组最优分类面合并作为最终的分类模型;音乐流派分类步骤,将最终的音乐测试集代入分类模型,如果音乐测试集中的测试样本落入相应的类别,则输出测试样本所对应的音乐流派类别结果;如果测试集中的测试样本散落在分类模型得出的不可分区域,则该测试样本作为不可分点,针对不可分点,按照其到各个类中心的加权欧氏距离来确定分属于各个类别的类别概率,类别概率低于设定最小类别概率阈值的类别标签被剔除,并将剩余类别类别概率重新百分比计算并按类别概率从大到小排序,以此作为该不可分点的类别概率输出结果;其中,不可分区域为不可让样本落入唯一类别的区域。2.根据权利要求1所述的基于特征加权模糊支持向量机的音乐流派分类方法,其特征在于:所述特征权重的计算及特征选择步骤,具体为:原始音乐数据集包含类别属性和特征属性,针对原始音乐数据集的各特征属性分别采用0均值归一化的方法进行归一化、原始音乐数据集的类别属性不变,得到归一化音乐数据集,将归一化音乐数据集按照1∶1的比例拆分为归一化音乐训练集和归一化音乐测试集;采用reliefF特征选择算法对归一化音乐训练集进行特征权重计算,得到每一个特征的特征权重;将特征权重按照从大到小排序,依次累加直到超过所有特征权重之和的80%,将剩余特征权重对应的特征在归一化音乐训练集和归一化音乐测试集上移除,得到最终的音乐训练集和音乐测试集。3.根据权利要求1所述的基于特征加权模糊支持向量机的音乐流派分类方法,其特征在于:所述隶属度确定步骤,具体为:分别对最终的音乐训练集里的每个类别,求取该类别内所有样本分别在各个特征上的平均值,以此作为该类别的类中心;分别对音乐训练集里的每个类别,求取该类别里各个样本到该类别中心的加权欧氏距离;分别对音乐训练集里的每个类别,取该类别下的最大加权欧式距离作为该类别特征空间超球体半径,将该类别里各个样本到该类别中心的加权欧氏距离与该类别特征空间超球体半径的作除,将数值1与作除的结果作差来确定该类别下各个样本的隶属度。4.根据权利要求1所述的基于特征加权模糊支持向量机的音乐流派分类方法,其特征在于:所述分类模型的训练步骤,具体为:先将最终的音乐训练集按照一类对其余的方式分组,假设共有c个类别,第一组把类别1的训练样本定为正样本,其余类别下的训练样本合起来定为负样本,第二组把类别2的训练样本定为正样本,其余类别下的训练样本合起来定为负样本,以此类推共分为c组;采用模糊支持向量机思想,将隶属度确定步骤得到的每个音乐训练样本的隶属度,作为各训练样本在分别构造c个类别的最优分类面判别式的惩罚系数;对每组训练集分别求出该组正类对应的类别的最优分类面,将各组最优分类面合并作为最终的分类模型。5.根据权利要求1所述的基于特征加权模糊支持向量机的音乐流派分类方法,其特征在于:所述按照其到各个类中心的加权欧氏距离来确定分属于各个类别的类别概率,具体为:按照计算类别概率;其中表示不可分点x#分属于第k个类别的类别概率,表示不可分点x#到各个类类中心的加权欧式距离的最大值,表示不可分点x#到第k个类类中心Ok的加权欧式距离,表示最小类别概率,c表示类别的个数。6.一种基于...

【专利技术属性】
技术研发人员:贾连印左喻灏丁家满游进国李晓武雷妍沈兵林胡俊涛
申请(专利权)人:昆明理工大学
类型:发明
国别省市:云南,53

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1