一种音频数据的特征提取方法及装置制造方法及图纸

技术编号：12941109 阅读：78 留言：0更新日期：2016-03-01 11:32

本发明专利技术公开了一种音频数据的特征提取方法及装置，用以实现从不同长度的音频数据序列中提取出相同长度的特征向量。方法包括：获得音频数据序列；针对获得的每个音频数据序列执行：将该音频数据序列进行切分，得到多个音频数据子序列；分别提取所述多个音频数据子序列中的每个音频数据子序列的指定特征；将提取到的各个音频数据子序列的指定特征进行组合；其中，所述多个音频数据子序列的数量等于预设数量；且所述多个音频数据子序列中的每个音频数据子序列均包含相同的数据总量。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种音频数据的特征提取方法及装置，用以实现从不同长度的音频数据序列中提取出相同长度的特征向量。方法包括：获得音频数据序列；针对获得的每个音频数据序列执行：将该音频数据序列进行切分，得到多个音频数据子序列；分别提取所述多个音频数据子序列中的每个音频数据子序列的指定特征；将提取到的各个音频数据子序列的指定特征进行组合；其中，所述多个音频数据子序列的数量等于预设数量；且所述多个音频数据子序列中的每个音频数据子序列均包含相同的数据总量。【专利说明】一种音频数据的特征提取方法及装置
本专利技术涉及信息处理领域，尤其涉及一种音频数据的特征提取方法及装置。
技术介绍
在音频分类与识别中，提取同一类别音频数据的共性特征非常重要，因为在现有技术中，通常需要依靠这些共性特征来对未知类别的音频数据进行分类识别。现有技术中采用的音频数据的共性特征的提取方案中，一般都是将时间定长的音频数据序列(即由多个音频数据组成的一个序列)进行分帧短时处理，即将时间定长的音频数据序列切分为多帧音频数据子序列，然后将得到的各帧音频数据子序列进行预处理之后，提取出各巾贞音频数据子序列的美尔倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)、线性预测美尔倒谱系数(Linear Predictive Mel Frequency Cepstral Coding,LPMFCC)等等。进一步地，再将从各帧音频数据子序列的特征组合起来作为该段音频数据的特征。采用该方式，可以实现根据训练用的各段音频数据序列的特征，对训...

【技术保护点】
一种音频数据的特征提取方法，其特征在于，包括：获得音频数据序列；针对获得的每个音频数据序列执行：将该音频数据序列进行切分，得到多个音频数据子序列；分别提取所述多个音频数据子序列中的每个音频数据子序列的指定特征；将提取到的各个音频数据子序列的指定特征进行组合；其中，所述多个音频数据子序列的数量等于预设数量；且所述多个音频数据子序列中的每个音频数据子序列均包含相同的数据总量。

【技术特征摘要】

【专利技术属性】
技术研发人员：谢志明，潘石柱，张兴明，傅利泉，朱江明，吴军，吴坚，
申请(专利权)人：浙江大华技术股份有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人