基于多特征音乐体载的分类方法及系统技术方案

技术编号:14637319 阅读:58 留言:0更新日期:2017-02-15 11:30
本发明专利技术提供了一种基于多特征音乐体载的分类方法及系统,方法为:获取音乐体载中的多帧音频信号,提取每一帧音频信号频谱的多个梅尔倒频谱系数,得到频域特征;对每一帧音频信号做离散小波变换,提取小波域特征;将频域特征和小波特征相结合计算,得到多个音乐体裁特征值,形成统计特征向量;将统计特征向量输入预先训练好的Logistic回归分类器,对音乐进行分类识别。本发明专利技术基于多特征音乐体载的分类方法及系统,把提取的频域特征和小波特征相结合计算其统计特征,这些统计特征融合成一个多维的向量,通过Logistic回归作为分类器,对音乐体裁进行分类识别,取得了较高的识别精度和分类效果。

【技术实现步骤摘要】

本专利技术涉及基于音乐内容检索领域,尤其涉及基于多特征音乐体载的分类方法及系统
技术介绍
随着音乐数据库中音乐数目的急剧增加,人们在海量的音乐信息中快速获得自己感兴趣的音乐体裁或者对大数据音乐进行体裁分类变得越来越困难,这就导致了基于音乐内容检索技术的兴起。音乐体裁的分类作为音乐内容检索技术中重要的一环,其研究日益引起人们的重视。音乐体裁的分类实际上就是音乐音频的分类,音乐的音频是一个随机的非平稳信号,音频的非语义符号表示和无结构化组织的特点增加了体裁分类的难度,因此,如何提取音频中的结构化信息和内容语义,使得无序的音频数据变得有序,是解决问题的关键。音频分类本质上是一个模式识别过程,包括特征提取与分类两个基本过程。在现有技术中,大多是基于频域特征梅尔倒频谱系数或者是小波域特征对音乐题材进行分类的,并不能充分利用音乐体裁的特征,因此获得的分类效率并不是很高。因此,现有技术中的技术缺陷是:基于频域特征梅尔倒频谱系数或者是小波域特征对音乐题材进行分类,对音乐体载特征的提取不充分,导致分类效率低,分类识别精度低,效果不理想。
技术实现思路
针对上述技术问题,本专利技术提供一种基于多特征音乐体载的分类方法及系统,在提取每一帧频域特征梅尔倒频谱系数(MFCC)的同时,也对每一帧信号做离散小波变换,提取小波域特征;把频域特征和小波特征相结合计算其统计特征,这些统计特征融合成一个多维的向量,通过Logistic回归作为分类器,对音乐体裁进行分类识别,取得了较高的识别精度和分类效果。为解决上述技术问题,本专利技术提供的技术方案是:第一方面,本专利技术提供一种基于多特征音乐体载的分类方法,包括:步骤S1,获取音乐体载中的多帧音频信号,提取每一帧音频信号频谱的多个梅尔倒频谱系数,得到频域特征;步骤S2,对所述每一帧音频信号做离散小波变换,提取小波域特征;步骤S3,将所述频域特征和所述小波特征相结合计算,得到多个音乐体裁特征值,形成统计特征向量;步骤S4,将所述统计特征向量输入预先训练好的Logistic回归分类器,对音乐进行分类识别。本专利技术基于多特征音乐体载的分类方法,其技术方案为:获取音乐体载中的多帧音频信号,提取每一帧音频信号频谱的多个梅尔倒频谱系数,得到频域特征;对所述每一帧音频信号做离散小波变换,提取小波域特征;将所述频域特征和所述小波特征相结合计算,得到多个音乐体裁特征值,形成统计特征向量;将所述统计特征向量输入预先训练好的Logistic回归分类器,对音乐进行分类识别。本专利技术基于多特征音乐体载的分类方法,在提取每一帧频域特征梅尔倒频谱系数(MFCC)的同时,也对每一帧信号做离散小波变换,提取小波域特征;把频域特征和小波特征相结合计算其统计特征,这些统计特征融合成一个多维的向量,通过Logistic回归作为分类器,对音乐体裁进行分类识别,取得了较高的识别精度和分类效果。进一步地,所述步骤S1中,所述提取每一帧音频信号的多个梅尔倒频谱系数,具体为:对每一帧音频信号进行快速傅里叶变换,得到所述每一帧音频信号的频谱;对所述每一帧音频信号的频谱进行滤波,得到频谱能量;对所述频谱能量取对数,进行离散余弦变换,得到多维梅尔倒频谱系数。进一步地,所述步骤S2中,所述提取小波域特征,具体为:对每一帧音频信号进行离散小波域变换,得到小波变换域;根据所述小波变换域,提取多维小波域特征。进一步地,所述步骤S3中,所述多个音乐体裁特征值的构造,具体为:计算多个梅尔倒频谱系数的平均值;计算所述多帧信号的能量平均值、方差,计算总的低能量帧的能量数,所述低能量帧为能量小于平均能量0.5倍的帧;计算所述多帧信号的质心、带宽、过零点的均值;计算所述多帧信号的基音变换率和等基音频率比例;将上述特征值组成的多维向量,形成统计特征,所述统计特征作为所述Logistic回归分类器的输入。进一步地,所述步骤S4中,所述统计特征向量的构成,具体为:在每个统计特征上都乘以一个回归系数,得到统计特征向量;将所述统计特征向量输入所述预先训练好的Logistic回归分类器,得到一个范围在0-1之间的数值,实现音乐体载的分类,所述Logistic回归分类器是利用Sigmoid函数构成的分类器。第二方面,本专利技术提供一种基于多特征音乐体载的分类系统,包括:频域特征提取模块,用于获取音乐体载中的多帧音频信号,提取每一帧音频信号频谱的多个梅尔倒频谱系数,得到频域特征;小波域特征提取模块,用于对所述每一帧音频信号做离散小波变换,提取小波域特征;统计特征向量生成模块,用于将所述频域特征和所述小波特征相结合计算,得到多个音乐体裁特征值,形成统计特征向量;音乐分类模块,用于将所述统计特征向量输入预先训练好的Logistic回归分类器,对音乐进行分类识别。本专利技术的基于多特征音乐体载的分类系统,其技术方案为:先通过频域特征提取模块,获取音乐体载中的多帧音频信号,提取每一帧音频信号频谱的多个梅尔倒频谱系数,得到频域特征;然后通过小波域特征提取模块,对所述每一帧音频信号做离散小波变换,提取小波域特征;接着通过统计特征向量生成模块,将所述频域特征和所述小波特征相结合计算,得到多个音乐体裁特征值,形成统计特征向量;最后通过音乐分类模块,将所述统计特征向量输入预先训练好的Logistic回归分类器,对音乐进行分类识别。本专利技术的基于多特征音乐体载的分类系统,在提取每一帧频域特征梅尔倒频谱系数(MFCC)的同时,也对每一帧信号做离散小波变换,提取小波域特征;把频域特征和小波特征相结合计算其统计特征,这些统计特征融合成一个多维的向量,通过Logistic回归作为分类器,对音乐体裁进行分类识别,取得了较高的识别精度和分类效果。进一步地,所述频域特征提取模块中,包括梅尔倒频谱系数提取子模块,用于:对每一帧音频信号进行快速傅里叶变换,得到所述每一帧音频信号的频谱;对所述每一帧音频信号的频谱进行滤波,得到频谱能量;对所述频谱能量取对数,进行离散余弦变换,得到多维梅尔倒频谱系数。进一步地,所述小波域特征提取模块中,包括小波域特征提取子模块,用于:对每一帧音频信号进行离散小波域变换,得到小波变换域;根据所述小波变换域,提取多维小波域特征。进一步地,所述统计特征向量生成模块中,包括特征值构造子模块,用于:计算多个梅尔倒频谱系数的平均值;计算所述多帧信号的能量平均值、方差,计算总的低能量帧的能量数,所述低能量帧为能量小于平均能量0.5倍的帧;计算所述多帧信号的质心、带宽、过零点的均值;计算所述多帧信号的基音变换率和等基音频率比例;将上述特征值组成的多维向量,形成统计特征,所述统计特征作为所述Logistic回归分类器的输入。进一步地,所述音乐分类模块中,包括统计特征构成子模块,用于:在每个统计特征上都乘以一个回归系数,得到统计特征向量;将所述统计特征向量输入所述预先训练好的Logistic回归分类器,得到一个范围在0-1之间的数值,实现音乐体载的分类,所述Logistic回归分类器是利用Sigmoid函数构成的分类器。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。图1示出了本专利技术第一实施例所提供的一种基于多特征音乐体载的分类方法的流程本文档来自技高网...
基于多特征音乐体载的分类方法及系统

【技术保护点】
基于多特征音乐体载的分类方法,其特征在于,包括:步骤S1,获取音乐体载中的多帧音频信号,提取每一帧音频信号频谱的多个梅尔倒频谱系数,得到频域特征;步骤S2,对所述每一帧音频信号做离散小波变换,提取小波域特征;步骤S3,将所述频域特征和所述小波特征相结合计算,得到多个音乐体裁特征值,形成统计特征向量;步骤S4,将所述统计特征向量输入预先训练好的Logistic回归分类器,对音乐进行分类识别。

【技术特征摘要】
1.基于多特征音乐体载的分类方法,其特征在于,包括:步骤S1,获取音乐体载中的多帧音频信号,提取每一帧音频信号频谱的多个梅尔倒频谱系数,得到频域特征;步骤S2,对所述每一帧音频信号做离散小波变换,提取小波域特征;步骤S3,将所述频域特征和所述小波特征相结合计算,得到多个音乐体裁特征值,形成统计特征向量;步骤S4,将所述统计特征向量输入预先训练好的Logistic回归分类器,对音乐进行分类识别。2.根据权利要求1所述基于多特征音乐体载的分类方法,其特征在于,所述步骤S1中,所述提取每一帧音频信号的多个梅尔倒频谱系数,具体为:对每一帧音频信号进行快速傅里叶变换,得到所述每一帧音频信号的频谱;对所述每一帧音频信号的频谱进行滤波,得到频谱能量;对所述频谱能量取对数,进行离散余弦变换,得到多维梅尔倒频谱系数。3.根据权利要求1所述基于多特征音乐体载的分类方法,其特征在于,所述步骤S2中,所述提取小波域特征,具体为:对每一帧音频信号进行离散小波域变换,得到小波变换域;根据所述小波变换域,提取多维小波域特征。4.根据权利要求1所述基于多特征音乐体载的分类方法,其特征在于,所述步骤S3中,所述多个音乐体裁特征值的构造,具体为:计算多个梅尔倒频谱系数的平均值;计算所述多帧信号的能量平均值、方差,计算总的低能量帧的能量数,所述低能量帧为能量小于平均能量0.5倍的帧;计算所述多帧信号的质心、带宽、过零点的均值;计算所述多帧信号的基音变换率和等基音频率比例;将上述特征值组成的多维向量,形成统计特征,所述统计特征作为所述Logistic回归分类器的输入。5.根据权利要求1所述基于多特征音乐体载的分类方法,其特征在于,所述步骤S4中,所述统计特征向量的构成,具体为:在每个统计特征上都乘以一个回归系数,得到统计特征向量;将所述统计特征向量输入所述预先训练好的Logistic回归分类器,得到一个范围在0-1之间的数值,实现音乐体载的分类,所述Logistic回归分类器是利用Sigmoid函数构成的分类器。6.基于多特征音乐体载的分类系...

【专利技术属性】
技术研发人员:熊继平王妃蔡丽桑
申请(专利权)人:浙江师范大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1