一种基于PSO-BP神经网络的民族乐器识别方法技术

技术编号:35488001 阅读:16 留言:0更新日期:2022-11-05 16:42
本发明专利技术适用于音频处理技术领域,尤其涉及一种基于PSO

【技术实现步骤摘要】
一种基于PSO

BP神经网络的民族乐器识别方法


[0001]本专利技术属于音频处理
,尤其涉及一种基于PSO

BP神经网络的民族乐器识别方法。

技术介绍

[0002]中国传统民族乐器的识别与分类,不仅有助于我们研究其巨大的科学研究价值,而且可以让世界更多的人能够了解中国民族乐器。近年来,国内不少的研究学者对中国民族乐器识别分类问题也进行了深入的研究,期望实现中国民族乐器准确的识别与分类。
[0003]现有技术中提出了基于lvq的神经网络分类算法,具有构造简单、输入矢量不必根据需要而进行归一化、正交换等长处。现有技术中还提出了隐马尔可夫分类算法,这种模型可以根据数据库大量信息的进行学习,推测出当某一个音或某几个音出现时接下来出现各个音的可能性,产生新的音乐。
[0004]但是现有技术中,面对高维问题也会有过早的收敛的问题,而且算法局部搜索能力比较差,搜索精度还不够高。

技术实现思路

[0005]本专利技术实施例的目的在于提供一种基于PSO

BP神经网络的民族乐器识别方法,旨在解决面对高维问题也会有过早的收敛的问题,而且算法局部搜索能力比较差,搜索精度还不够高的问题。
[0006]本专利技术实施例是这样实现的,一种基于PSO

BP神经网络的民族乐器识别方法,所述方法包括:
[0007]输入数据源,利用mel滤波器对数据源进行滤波处理,提取得到标准梅尔倒谱参数特征MFCC;
[0008]利用提取得到的标准梅尔倒谱参数特征MFCC对PSO

BP神经网络分类模型进行训练;
[0009]将需要识别的民族乐器音频输入经过训练的PSO

BP神经网络分类模型,得到识别结果。
[0010]优选的,构建所述PSO

BP神经网络分类模型的步骤,具体包括:
[0011]初始步优化与特定粒子群结构的参数,所述参数包括粒子群在集群的元素个数、最大迭代的发生次数、粒子的位置和速度;
[0012]通过适应度函数来评估和计算各种粒子适应度值,并进行评价;
[0013]根据粒子适应度值分别对Pbest和Gbest进行更新,根据速率公式更新整个粒子群的中心位置和移动速度,判断是否满足输出条件,若满足条件则输出结果,否则返回上一步骤;
[0014]将经过改进pso算法进行计算优化后的最优权值和阈数值分别传递给具有bp的神经网络分类模型,输入训练集,进行逻辑学习与计算训练,训练完成后得到pso

bp神经网络
分类模型。
[0015]优选的,所述输出条件为迭代次数达到限定次数或者获得最佳适应度值。
[0016]优选的,改进pso算法中采用线性向量递减算法惯性向量权重算法,公式如下:
[0017]ω(k)=ω
start


start

ω
end
)(T
max

k)/T
max

[0018]其中,ω
start
为初始惯性权重,ω
end
为迭代至最大次数时的惯性权重,k为当前迭代代数,T
max
为最大迭代代数情况下,惯性权值取值为ω
start
=0.9,ω
end
=0.4。
[0019]优选的,输入数据源,利用mel滤波器对数据源进行滤波处理,提取得到标准梅尔倒谱参数特征MFCC的步骤,具体包括:
[0020]输入数据源,通过高通滤波器进行预加重处理,所述高通滤波器为:
[0021]H(Z)=1

μz
‑1,式中μ为0.98;
[0022]对数据点进行分帧,1024点被划分为一帧,
[0023]加上汉明窗,对每一帧数据点进行fft变换,将所有的能量谱经由一组12个mel尺度的三角形滤波器组,mel滤波器组的公式如下:
[0024][0025]式中,
[0026][0027]经过离散余弦变换后,得到标准梅尔倒谱参数特征MFCC。
[0028]优选的,提取标准梅尔倒谱参数特征MFCC时,同时提取相应的一阶差分计算参数和二阶差分计算参数,则MFCC的全部差分计算参数是由12维MFCC系数+12维一阶差分计算参数+12维二阶差分计算参数组成的36维MFCC差分计算参数。
[0029]优选的,差分计算参数的计算采用如下公式:
[0030][0031]式中,表示第m个一阶差分计算参数,C
m
表示第m个梅尔倒谱系数,Q表示梅尔倒谱系数的阶数,K表示一阶导数的时间差,将上式的结果再代入得到二阶差分计算参数。
[0032]本专利技术实施例的另一目的在于提供一种基于PSO

BP神经网络的民族乐器识别系统,所述系统包括:
[0033]特征提取模块,用于输入数据源,利用mel滤波器对数据源进行滤波处理,提取得到标准梅尔倒谱参数特征MFCC;
[0034]模型训练模块,用于利用提取得到的标准梅尔倒谱参数特征MFCC对PSO

BP神经网络分类模型进行训练;
[0035]乐器识别模块,用于将需要识别的民族乐器音频输入经过训练的PSO

BP神经网络
分类模型,得到识别结果。
[0036]本专利技术实施例的另一目的在于提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如上所述基于PSO

BP神经网络的民族乐器识别方法的步骤。
[0037]本专利技术实施例的另一目的在于提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上所述基于PSO

BP神经网络的民族乐器识别方法的步骤。
[0038]本专利技术实施例提供的一种基于PSO

BP神经网络的民族乐器识别方法,创建了pso

bp神经网络的分类系统,使用建立的中国乐器特征的训练集对pso

bp神经网络进行学习训练,训练后得到训练好的pso

bp神经网络分类模型,使用分类模型对测试集进行识别和分类测试。总体实验结果表现很好,识别率均超过99%,平均分类准确率为99.78%,超过了现行算法,本专利技术具有较高的准确性与实用性。
附图说明
[0039]图1为本专利技术实施例提供的一种基于PSO

BP神经网络的民族乐器识别方法的流程图;
[0040]图2为本专利技术实施例提供的一种基于PSO

BP神经网络的民族乐器识别系统的架构图;
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于PSO

BP神经网络的民族乐器识别方法,其特征在于,所述方法包括:输入数据源,利用mel滤波器对数据源进行滤波处理,提取得到标准梅尔倒谱参数特征MFCC;利用提取得到的标准梅尔倒谱参数特征MFCC对PSO

BP神经网络分类模型进行训练;将需要识别的民族乐器音频输入经过训练的PSO

BP神经网络分类模型,得到识别结果。2.根据权利要求1所述的基于PSO

BP神经网络的民族乐器识别方法,其特征在于,构建所述PSO

BP神经网络分类模型的步骤,具体包括:初始步优化与特定粒子群结构的参数,所述参数包括粒子群在集群的元素个数、最大迭代的发生次数、粒子的位置和速度;通过适应度函数来评估和计算各种粒子适应度值,并进行评价;根据粒子适应度值分别对Pbest和Gbest进行更新,根据速率公式更新整个粒子群的中心位置和移动速度,判断是否满足输出条件,若满足条件则输出结果,否则返回上一步骤;将经过改进pso算法进行计算优化后的最优权值和阈数值分别传递给具有bp的神经网络分类模型,输入训练集,进行逻辑学习与计算训练,训练完成后得到pso

bp神经网络分类模型。3.根据权利要求2所述的基于PSO

BP神经网络的民族乐器识别方法,其特征在于,所述输出条件为迭代次数达到限定次数或者获得最佳适应度值。4.根据权利要求2所述的基于PSO

BP神经网络的民族乐器识别方法,其特征在于,改进pso算法中采用线性向量递减算法惯性向量权重算法,公式如下:ω(k)=ω
start


start

ω
end
)(T
max
...

【专利技术属性】
技术研发人员:李峰王玲玲
申请(专利权)人:安徽财经大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1