一种基于音频特征信号的分类方法技术

技术编号:20047556 阅读:38 留言:0更新日期:2019-01-09 05:01
本发明专利技术涉及一种基于音频特征信号的分类方法,属于音频信号处理技术领域。本发明专利技术对降维处理后的音频特征信号利用高斯核函数和贝叶斯先验知识进行分类。本发明专利技术的基于音频特征信号的分类算法可用于音频广播监听、人工智能语音识别、音频场景模式区分等。本发明专利技术主要是针对音频特征信号系数域特征进行音频分类,与现有的基于音频内容进行分类的技术先比,本发明专利技术更具普适性与稳定性。本发明专利技术利用高斯核函数优良的非线性特征与高效的优化算法从而避免了因用线性映射导致的应用场景单一、运行速度慢、分类效果差的缺点。本算法理论也较为简单并且易于编程实现,更加实用与实际工程项目中。

【技术实现步骤摘要】
一种基于音频特征信号的分类方法
本专利技术涉及一种基于音频特征信号的分类方法,属于音频特征信号处理

技术介绍
为了提高基于音频信号的识别效率和准确率,同时音频特征分类在对于无线广播的音频监听管控中也是有着举足轻重的地位,故对基于音频特征信号的分类算法研究就显得尤其重要,而就目前的主要的分类算法有贝叶斯分类算法、决策树算法、支持向量机算法等,对于这些分类算法大多是分类效果较差、算法复杂、计算量较大、编程不易于实现等。本算法是利用了高斯核函数优良的非线性特性,同时又结合了贝叶斯先验理论,在针对进行降维处理后的音频特征信号的分类问题上可取得较为满意的结果,在实际的工程中也是展示出出色的效果。
技术实现思路
本专利技术要解决的技术问题是提供一种基于音频特征信号的分类方法,首先对音频信号进行音频特征参数提取并且进行降维处理,将降维后的特征参数送入搭建好的分类模型中,利用输入输出相似性概率大小判断测试点的所属类别,从而实现音频分类的目的即音频识别。本专利技术的技术方案是:一种基于音频特征信号的分类方法。该方法具体包括以下步骤:(1)音频信号采集:采集音频信号,获得音频样本。(2)音频信号预本文档来自技高网...

【技术保护点】
1.一种基于音频特征信号的分类方法,其特征在于:具体步骤如下:(1)音频信号采集:采集音频信号,获得音频样本;(2)音频信号预处理:将所采集的音频样本中的模拟信号转换为数字信号,将数字信号写入WAV文件中,对写入WAV文件中的数字信号进行滤波、预加重、分帧处理;(3)特征参数提取:对预处理后的音频信号进行高维特征参量的提取,包括线性预测系数、线性预测倒谱系数和梅尔频率倒谱系数;(4)特征参量降维:将上述提取出的高维特征参量送入搭建好的降维模型中进行降维处理并保存;(5)分类模型的搭建:首先用服从高斯分布的隐函数f描述一个类同另外一个类的相似性,其次用压缩函数将f的输出值压缩到[0 1]范围,根...

【技术特征摘要】
1.一种基于音频特征信号的分类方法,其特征在于:具体步骤如下:(1)音频信号采集:采集音频信号,获得音频样本;(2)音频信号预处理:将所采集的音频样本中的模拟信号转换为数字信号,将数字信号写入WAV文件中,对写入WAV文件中的数字信号进行滤波、预加重、分帧处理;(3)特征参数提取:对预处理后的音频信号进行高维特征参量的提取,包括线性预测系数、线性预测倒谱系数和梅尔频率倒谱系数;(4)特征参量降维:将上述提取出的高维特征参量送入搭建好的降维模型中进行降维处理并保存;(5)分类模型的搭建:首先用服从高斯分布的隐函数f描述一个类同另外一个类的相似性,其次用压缩函数将f的输出值压缩到[01]范围,根据压缩值大小进行类别区分,所搭建的模型即为所需的分类模型;(6)音频特征参量分类:将步骤(4)中降维后的音频信号的高维特征参量送入步骤(5)所述的分类模型中进行分类,并将其分类结果进行可视化展示。2.根据权利要求1所述的基于音频特征信号的分类方法,其特征在于:所述音频信号的采集是通过音频采集装置进行采样,音频采集装置对音频信号采集时需设置好采样频率、采样声道数和量化精度。3.根据权利要求1所述的基于音频特征信号的分类方法,其特征在于:所述信号预处理包括以下步骤:(1)采用矩形窗函数w(n)对采集的音频信号x(n)进行滤波处理得到信号ya(n),其中(2)将滤波处理得到信号ya(n)预加重并分割成若干段音频帧信号,帧与帧之间部分重叠。4.根据权利要求1所述的基于音频特征信号的分类方法,其特征在于:所述特征参数提取是对分帧后的音频信号进行线性预测系数、线性预测倒谱系数和梅尔频率倒谱系数的特征参数提取,分别保存入3个表格中。5.根据权利要求1所述的基于音频特征信号的分类方法,其特征在于:所述特征参量降维具体步骤为:利用Fisher准则对音频特征信号进行降维处理,选取Fisher大的维分量定义为x作为降维结果从而达到降维的目的,其中Fisher线性判别准则如下式中rFisher是特征分量的Fisher比或者Fisher判据;οbetween表示特征分量的类间方差,即不同语音特征分量均值的方差;οwithin表示特征分量的类内方差,即同一语音特征分量的方差均值;其中ρ表示特征参数的维数;表示语音特征第ρ维分量在所有类上...

【专利技术属性】
技术研发人员:龙华杨明亮邵玉斌杜庆治
申请(专利权)人:昆明理工大学
类型:发明
国别省市:云南,53

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1