The invention relates to an adaptive channel synthesis method for audio event model, belonging to the field of computer and information science and technology. The present invention first to recognize audio preprocessing and feature extraction, including quantization of audio sampling, pre emphasis and windowing, and the underlying parameters of the audio frame sequence extraction and feature segmentation, audio feature segment vector; then the audio event model into training, construct a universal background model and the original audio event model; finally audio synthesis using the event model, selective adaptive audio event model, and complete the event detection and recognition. The invention can obviously improve the performance of audio event recognition under different channel mismatching conditions, and the adaptive identification accuracy and recall rate are close to the channel matching situation, and the channel adaptation of the model domain is effectively realized.
【技术实现步骤摘要】
一种音频事件模型合成信道自适应方法
本专利技术涉及一种音频事件模型合成信道自适应方法,属于计算机与信息科学
技术介绍
音频事件模型可识别、分类具有特定语义或内容的音频片段。为了解决不同音频传输信道对音频特征参数的差异性影响,而引发的模型识别能力下降问题,需要对产生了畸变的音频特征参数进行自适应调整。因此,本专利技术将提供一种音频事件模型合成信道自适应方法来提高系统在信道畸变环境下的事件识别能力。音频事件模型合成信道自适应方法需要解决的基本问题是:判定待识别音频的信道类型并为其合成信道自适应后的音频事件模型。综观现有的模型域信道自适应方法,通常使用方法可归为三类:1.潜在因子分析潜在因子分析法(LatentFactorAnalysis,LFA)一般结合高斯混合模型-通用背景模型(GaussianMixtureModel-UniversalBackgroundModel,GMM-UBM)对信道进行模型域自适应。该方法的基本原理是对音频中的事件信息及信道信息进行分解,并对信道信息进行消除。假设音频事件S通过信道C传输,高斯混合模型及通用背景模型的均值超向量分别 ...
【技术保护点】
一种音频事件模型合成信道自适应方法,其特征在于所述方法包括如下步骤:步骤1,对音频进行预处理及特征提取,包括:音频量化、采样、预加重和加窗,对音频处理所需的音频特征参数进行提取,然后对提取到的特征帧序列按照一定的段长和段移进行切分以获得段特征向量;步骤2,利用包含各类信道类型的训练特征数据对通用背景模型进行训练,然后在相应信道模型的基础上基于事件数据特征训练特定信道类型下的音频事件原始模型;步骤3,对待识别音频的特征向量进行信道判别,如果其信道类型与音频事件原始模型的信道类型一致,则直接进行事件判别;若信道类型不一致,则进行音频事件模型转换,将原始模型调整为与待识别音频信道 ...
【技术特征摘要】
1.一种音频事件模型合成信道自适应方法,其特征在于所述方法包括如下步骤:步骤1,对音频进行预处理及特征提取,包括:音频量化、采样、预加重和加窗,对音频处理所需的音频特征参数进行提取,然后对提取到的特征帧序列按照一定的段长和段移进行切分以获得段特征向量;步骤2,利用包含各类信道类型的训练特征数据对通用背景模型进行训练,然后在相应信道模型的基础上基于事件数据特征训练特定信道类型下的音频事件原始模型;步骤3,对待识别音频的特征向量进行信道判别,如果其信道类型与音频事件原始模型的信道类型一致,则直接进行事件判别;若信道类型不一致,则进行音频事件模型转换,将原始模型调整为与待识别音频信道一致的自适应音频事件模型,再对待识别音频进行事件判别。2.根据权利要求1所述的一种音频事件模型合成信道自适应方法,其特征在于:步骤2中基于包含多种信道的信道自适应训练音频数据集构建信道无关的基础UBM模型,其中分别为第i个高斯概率密度函数的权重、均值和方差。3.根据权利要求1所述的一种音频事件模型合成信道自适应方法,其特征在于:步骤2中基于特定信道训练音频数据,使用MAP方法自适应该信道下的UBM模型,针对n信道构建GMM模型。4.根据权...
【专利技术属性】
技术研发人员:罗森林,刘晓双,潘丽敏,吕英,
申请(专利权)人:北京理工大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。