一种基于RBF神经网络的多种乐器调音方法技术

技术编号:17305764 阅读:26 留言:0更新日期:2018-02-19 01:04
一种基于RBF神经网络的多种乐器调音方法,包括如下步骤:输入音符,音频预处理,处理后的音频参数作为输入参数输入到RBF乐器判别网络,输出乐器分类结果;根据分类结果,利用算法匹配相应的调整模式,进行音频变换,相当于归一化处理;将归一化处理过的音频,作为输入参数输入到RBF音准判别网络,输出当前音高值;实际音高值和想要调节的标准音高值进行差值运算,输出调节结果。本发明专利技术不需要多次人为差值计算,只要给出足够的训练样本数量,让神经网络自己学习计算,可以实现以任意精度逼近,一经训练,可重复使用,输出高效快捷,也可以通过更改训练样本来更换精度,不需要以牺牲采样频率为代价。

A variety of musical instrument tuning methods based on RBF neural network

A variety of musical instrument tuning method based on RBF neural network, which comprises the following steps: inputting notes, audio processing, audio processing parameters as input parameters input to the RBF instrument discrimination network, output instrument classification results; according to the classification results using pattern matching algorithm to adjust the audio conversion, equivalent normalization the processed audio; normalization, as input parameters input to the RBF pitch discrimination network, output current pitch value; actual pitch value and want to adjust standard pitch value subtraction operation, the output adjustment results. The invention does not require multiple human difference calculation, as long as sufficient number of training samples, let their neural network learning calculation can be implemented in any precision, a trained, reusable, output and efficient, can also be changed through training samples to replace the precision, no need to sacrifice the cost of sampling frequency.

【技术实现步骤摘要】
一种基于RBF神经网络的多种乐器调音方法
本专利技术涉及乐器调音方法
,尤其涉及一种基于RBF神经网络的多种乐器调音方法。
技术介绍
乐器调音是每个自学者学习使用乐器的必经之路,现有的调音方法,虽然简单方便,但是调音的精度不高,尤其是不能针对多种乐器,没有良好的普适性,易出错,甚至损耗琴弦,不适合初学者。现有调音器只能显示出输入声音与标准音调之间的细微差别,以便于用户对乐器进行手工调整。但精度需要人为差值计算,有时还需要降低采样频率来满足相应的精度。
技术实现思路
本专利技术的目的在于解决上述问题提出一种基于RBF神经网络的多种乐器调音方法,可以针对多种乐器,通过人工神经网络方法实现自动识别所调乐器,识别后经过算法匹配,快速匹配出适合的收音MIC模式,调音时,采用人工神经网络的径向基函数网络的方法进行逼近拟合,输出相应的结果,能快速有效地帮助使用者调音。为了达到此目的,本专利技术采用以下技术方案:一种基于RBF神经网络的多种乐器调音方法,包括如下步骤:A.输入音符,音频预处理,处理后的音频参数作为输入参数输入到RBF乐器判别网络,输出乐器分类结果;B.根据分类结果,利用算法匹配相应的调整模式,进行音频变换,相当于归一化处理;C.将归一化处理过的音频,作为输入参数输入到RBF音准判别网络,输出当前音高值;D.实际音高值和想要调节的标准音高值进行差值运算,输出调节结果。更优的,RBF乐器分类网络训练包括如下步骤:步骤一、根据任意乐器的特征参数T组成特征向量Xk=[Tk1,Tk2,Tk3,…TkM],则训练样本集为X=[X1,X2,X3…Xk…XN](k=1,2,3…N);步骤二、贴上对应的标签,对应为乐器输出类别为Yk=[yk1,yk2,yk3,…ykj,ykJ])J=1,2,3…J为输出的类别);步骤三、构建RBF乐器分类网络;步骤四、设定网络参数;步骤五、当RBF乐器判别网络的数据中心和扩展常数确定之后,可以由输入输出层的权值矢量W=[W1,W2,W3,…Wh]T;步骤六、得出相应的参数后,RBF乐器分类网络训练完毕。更优的,RBF乐器分类网络的结构为三层前馈神经网络,包括输入层,隐含层和输出层;所述隐含层由模式层和求和层构成。更优的,所述输入层的节点数为M,所述模式层的节点数为N,所述求和层的节点数为J,所述输出层的节点数为J。更优的,所述模式层选用径向基函数为高斯函数更优的,RBF音准判别网络训练包括以下步骤:步骤一、构建RBF音准判别网络;步骤二、设定网络参数;步骤三、当RBF乐器判别网络的数据中心和扩展常数确定之后,可以由输入输出得出输出的权值矢量W=[W1,W2,W3,…Wh]T;步骤四、得出相应的参数后,RBF音准判别网络训练完毕。更优的,所述RBF乐器音准判别网络的结构为三层前馈神经网络,包括输入层,隐含层和输出层;所述隐含层的神经元个数为训练样本中的音阶数,构建出正规化的RBF网络,可以以任一精度逼近音高谱线。更优的,隐含层选用径向基函数为反射sigmoid函数本专利技术的目的在于提出一种基于RBF神经网络的多种乐器调音方法,不需要多次人为差值计算,只要给出足够的训练样本数量,让神经网络自己学习计算,可以实现以任意精度逼近,一经训练,可重复使用,输出高效快捷,也可以通过更改训练样本来更换精度,不需要以牺牲采样频率为代价。附图说明图1为本专利技术的一个实施例的流程图;图2为本专利技术的一个实施例的RBF乐器识别网络的结构图;图3为本专利技术的一个实施例的RBF音准判别网络的结构图;其中:1为RBF乐器识别网络的输入层;2为RBF乐器识别网络的模式层;3为RBF乐器识别网络的求和层;4为RBF乐器识别网络的输出层;5为RBF音准判别网络的输入层;6为RBF音准判别网络的输出层。具体实施方式下面结合附图并通过具体实施例方式来进一步说明本专利技术的技术方案。一种基于RBF神经网络的多种乐器调音方法,其特征在于,包括如下步骤:A.输入音符,音频预处理,处理后的音频参数作为输入参数输入到RBF乐器判别网络,输出乐器分类结果;B.根据分类结果,利用算法匹配相应的调整模式,进行音频变换,相当于归一化处理;C.将归一化处理过的音频,作为输入参数输入到RBF音准判别网络,输出当前音高值;D.实际音高值和想要调节的标准音高值进行差值运算,输出调节结果。更具体的,首先,需要对音频进行预处理,采样量化,分帧加窗,根据频谱特性和现有的声学知识选择各乐器音色的特征参数,将各个音色转化为特征向量,所以每个乐器的特征向量肯定不同的,并贴上分类标签,选取适量样本,创建RBF神经网络,进行样本学习,训练好的网络具有乐器分类功能,网络的输入乐器的特征向量,网络的输出是基于0,1表达的分类形式,例如:有5种乐器待分类,第一类输出[1,0,0,0,0],第二类输出则为[0,1,0,0,0]…即一个输出神经元代表一类乐器属性,当输出层的该类别的竞争神经元获胜时,该神经元输出值为1,其他神经元输出为0,这样就简单实现了分类功能。选择RBF神经网络进行训练,是因为它采用径向基函数作为隐含层的中心,具有局部响应特性,在训练网络时隐含层的神经元数量可以根据训练样本的分布适当减少,根据乐器样本的特征及网络的输出分类直接获得RBF隐含层单元的连接权值,无需反复训练,缩短训练时间,提高网络创建效率。求和层属于某类的概率累计,从而得到该模式的估计概率密度函数,每一类只有一个求和层单元,并且只与属于自己类的神经元相连接,所以求和层单元简单地将属于自己类的模式层单元的输出相加,而与其他类别的模式层单元的输出无关。这样网络的扩充性能好,结构设计灵活,允许增加或减少新的乐器识别样本,而无需重新进行长时间的训练学习。RBF神经网络输出的为乐器识别的分类结果,由0,1编码实现,利用匹配算法将分类结果与选择的MIC规格模式联系起来,进行音频变换补偿处理。处理过的音频,作为输入参数项,传送进已训练好的RBF音准判别网络。最后,实现音阶识别,利用RBF可以用作通用逼近器的特性,输入已有音高的训练样本集,用于训练正则化的RBF,可以精确构建音频谱的响应面,类似一个精确插值的过程,训练好的音阶识别RBF网络是一个音频谱的响应面。当使用网络进行调音时,网络的输入是由拾音器拾取的一个未知音阶,输入到网络后会得到一个实际值,这个值会和标准值进行比对,差值运算,根据得出的值判定调节。更进一步的说明,RBF乐器分类网络训练包括如下步骤:步骤一、根据任意乐器的特征参数T组成特征向量Xk=[Tk1,Tk2,Tk3,…TkM],则训练样本集为X=[X1,X2,X3…Xk…XN](k=1,2,3…N);步骤二、贴上对应的标签,对应为乐器输出类别为Yk=[yk1,yk2,yk3,…ykj,ykJ])J=1,2,3…J为输出的类别);步骤三、构建RBF乐器分类网络;步骤四、设定网络参数;步骤五、当RBF乐器判别网络的数据中心和扩展常数确定之后,可以由输入输出层的权值矢量W=[W1,W2,W3,…Wh]T;步骤六、得出相应的参数后,RBF乐器分类网络训练完毕。更进一步的说明,RBF乐器分类网络的结构为三层前馈神经网络,包括输入层,隐含层和输出层;所述隐含层由模式层和求和层构成。本例中,输入层输入乐器的特征向本文档来自技高网...
一种基于RBF神经网络的多种乐器调音方法

【技术保护点】
一种基于RBF神经网络的多种乐器调音方法,其特征在于,包括如下步骤:A.输入音符,音频预处理,处理后的音频参数作为输入参数输入到RBF乐器判别网络,输出乐器分类结果;B.根据分类结果,利用算法匹配相应的调整模式,进行音频变换,相当于归一化处理;C.将归一化处理过的音频,作为输入参数输入到RBF音准判别网络,输出当前音高值;D.实际音高值和想要调节的标准音高值进行差值运算,输出调节结果。

【技术特征摘要】
1.一种基于RBF神经网络的多种乐器调音方法,其特征在于,包括如下步骤:A.输入音符,音频预处理,处理后的音频参数作为输入参数输入到RBF乐器判别网络,输出乐器分类结果;B.根据分类结果,利用算法匹配相应的调整模式,进行音频变换,相当于归一化处理;C.将归一化处理过的音频,作为输入参数输入到RBF音准判别网络,输出当前音高值;D.实际音高值和想要调节的标准音高值进行差值运算,输出调节结果。2.根据权利要求1所述的一种基于RBF神经网络的多种乐器调音方法,其特征在于:RBF乐器分类网络训练包括如下步骤:步骤一、根据任意乐器的特征参数T组成特征向量Xk=[Tk1,Tk2,Tk3,…TkM],则训练样本集为X=[X1,X2,X3…Xk…XN](k=1,2,3…N);步骤二、贴上对应的标签,对应为乐器输出类别为Yk=[yk1,yk2,yk3,…ykj,ykJ])J=1,2,3…J为输出的类别);步骤三、构建RBF乐器分类网络;步骤四、设定网络参数;步骤五、当RBF乐器判别网络的数据中心和扩展常数确定之后,可以由输入输出层的权值矢量W=[W1,W2,W3,…Wh]T;步骤六、得出相应的参数后,RBF乐器分类网络训练完毕。3.根据权利要求2所述的一种基于RBF神经网络的多种乐器调音方法,其特征在于:RBF...

【专利技术属性】
技术研发人员:夏楠李海艳黄运保
申请(专利权)人:广东工业大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1