一种GMM识别器的快速识别方法技术

技术编号:20026659 阅读:25 留言:0更新日期:2019-01-06 05:24
本发明专利技术公开了一种GMM识别器的快速识别方法,包括以GMM模型中的均值矢量为VQ码本的训练数据,构建VQ码本;构建VQ码字与GMM模型的依存关系知识;利用VQ码字与GMM模型的依存关系知识筛选出待识别的GMM模型,筛选出的GMM模型组成GMM模型子集;计算待识别的矢量X与GMM模型子集中各个GMM模型的输出概率,获得识别结果。本发明专利技术通过GMM模型中的Gaussian函数的均值矢量构建信号特征空间的描述,相对于现有技术,通过构建基于信号特征空间的VQ码本,依照VQ码字与Gaussian函数的归属关系筛选获得部分GMM模型有更大的概率属于测试样本的GMM模型,提高入选GMM模型为测试样本模型的准确度;同时本技术方案只遍历最有可能的部分GMM模型的模型分量,降低似然度的计算量,减少识别时间。

【技术实现步骤摘要】
一种GMM识别器的快速识别方法
本专利技术涉及智能识别
,更具体地说涉及一种GMM(高斯混合模型)识别器快速识别方法。
技术介绍
GMM(高斯混合模型)采用多个高斯概率密度函数(正态分布曲线)精确地量化事物,即将一个事物分解为若干的基于高斯概率密度函数形成的数学模型。目前基于GMM模型的识别分类器广泛应用于智能模式识别,并且已在说话人识别(SpeakerRecognition)、音频事件识别(AcousticEventRecognition)、语音识别(SpeechRecognition)、语种识别(LanguageRecognition)、手写字识别(HandwritingRecognition)等应用领域成为了主流的识别分类方法。随着技术发展和应用需求的不断增加,智能模式识别系统需要建立的识别分类对象规模也在不断增加。如一个功能强大的说话人识别系统,手写字识别系统等需要建立上千个以上的说话人和手写体GMM模型,因此降低测试样本分类识别所需的计算时间已成为实时模式识别系统最需要解决的问题之一。识别所需的计算时间取决于测试样本与GMM模型的似然度计算过程。对于实时的分类识别,系统必须快速对未知的测试样本进行GMM的模型识别。传统的GMM识别器识别方法(例如公开号为CN103914811A的专利技术专利基于GMM模型进行SAR图像检索分类,公开号为CN102324232A的专利技术专利基于GMM模型进行声纹识别)在训练阶段对已知对象(如已知说话人,已知音频事件等)进行GMM模型训练,测试阶段通过提取测试样本的特征参数,计算特征参数与GMM模型集合的似然度值,最后最大的似然值对应的GMM模型为测试样本的识别结果。传统的GMM识别器在训练对象较少的情况下(如需要训练的说话人数量较少)能够取得较好的性能,但是在训练对象规模较大的情况下,实时性能就不能得到保证,究其原因在于测试样本与GMM模型的似然度计算实质是测试样本与GMM模型的多个高斯概率密度函数的似然度计算,当训练对象较多的情况下,需要识别的GMM模型越多,因此遍历识别的时间越长。针对上述问题,目前GMM识别器主流快速识别方法主要基于只识别最有可能的GMM模型的思路,这类方法(如Vijendraetal.2009;Sarkaretal.2010)通过一些快速方法(例如最大似然度线性回归,MaximumLikelihoodLinearRegression,MLLR)找出与测试样本最可能的GMM模型集合,在计算似然度的过程中只遍历这些最有可能的GMM模型,以达到节省时间的效果。这类方法在识别测试样本时仍需要遍历GMM模型集合的所有模型分量,因此在训练对象规模较大的情况下,实时性就不如理想。GMM模型采用多个Gaussian(高斯)分量描述信号的特征空间,然而由于每个测试样本存在差异,每个Gaussian分量对于测试样本的贡献程度是不一样的,即存在某些Gaussian分量与测试样本的似然度值较大,某些Gaussian分量与测试样本的似然度值可以忽略不计。目前GMM识别器主流快速识别方法忽略了GMM模型该重要特性,因此算法效率和实时性能仍有较大的改善空间。
技术实现思路
本专利技术要解决的技术问题是:如何提高GMM识别器对测试样本进行识别的实时性。本专利技术解决其技术问题的解决方案是:一种GMM识别器的快速识别方法,包括以下步骤:步骤1,以待识别的GMM模型中的Gaussian(高斯)函数中的均值矢量为VQ码本的训练数据,采用无监督聚类方法构建VQ码本;步骤2,构建VQ码本中的VQ码字与GMM模型的依存关系知识;步骤3,待识别的矢量X首先依据邻近原则选择N个VQ码字,利用VQ码字与GMM模型的依存关系知识筛选出待识别的GMM模型,筛选出的GMM模型组成GMM模型子集;步骤4,计算待识别的矢量X与GMM模型子集中各个GMM模型的输出概率,获得待识别矢量X的GMM识别器的识别结果。作为上述技术方案的进一步改进,步骤1中,各个所述GMM模型的Gaussian函数中的均值矢量共同构成均值矢量集其中n为GMM模型编号,m为GMM模型的Gaussian分量索引;按照Gaussian函数空间邻近聚类原则,采用K均值聚类算法对均值矢量集构建K个VQ码字的VQ码本W={wi,i=1,2,…,K},其中wi表示第i个VQ码字。作为上述技术方案的进一步改进,步骤2中VQ码本中的VQ码字wi与GMM模型的依存关系知识由该VQ码字wi包含的Gaussian模型分量Gaussian分量权重和以及GMM模型编号构成。其中表示VQ码字wi的第j个GMM模型的第l个Gaussian模型分量,表示VQ码字wi的第j个GMM模型的Gaussian分量权重和,表示码字wi的第j个GMM模型编号。作为上述技术方案的进一步改进,所述Gaussian模型分量按与VQ码字距离从小到大存储;Gaussian分量权重和按照权重和从大到小存储;GMM模型编号按Gaussian分量权重和从大到小存储。作为上述技术方案的进一步改进,步骤3中,采用欧氏距离计算待识别的矢量X与所有VQ码字的距离序列,确定矢量X在VQ码本构建的信号特征空间的位置;距离序列从小到大存储,选取距离序列中最小的前N个VQ码字,N个VQ码字组成矢量X的近邻码字子集。作为上述技术方案的进一步改进,步骤3中,利用近邻码字子集中的VQ码字与GMM模型的依存关系知识,计算待识别矢量X的近邻码字子集中GMM模型的Gaussian分量权重和,选取Gaussian分量权重和最大的前M个GMM模型,所选的M个GMM模型组成GMM模型子集。作为上述技术方案的进一步改进,步骤4中,对待识别矢量X与GMM模型子集中各个GMM模型的Gaussian模型分量进行输出概率计算,输出概率最大的GMM模型作为待识别矢量X的GMM识别器的识别结果。作为上述技术方案的进一步改进,步骤1中VQ码字个数K、步骤3中近邻码字子集的VQ码字个数N、以及GMM模型子集中GMM模型个数M均可自由配置。本专利技术的有益效果是:本专利技术通过GMM模型中的Gaussian函数的均值矢量构建信号特征空间的描述,相对于现有技术,通过构建基于信号特征空间的VQ码本,依照VQ码字与Gaussian函数的归属关系筛选获得部分GMM模型有更大的概率属于测试样本的GMM模型,提高入选GMM模型为测试样本模型的准确度;同时本技术方案只遍历最有可能的部分GMM模型的模型分量,降低似然度的计算量,减少识别时间。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单说明。显然,所描述的附图只是本专利技术的一部分实施例,而不是全部实施例,本领域的技术人员在不付出创造性劳动的前提下,还可以根据这些附图获得其他设计方案和附图。图1是本专利技术的识别方法流程图;图2是本专利技术构建信号特征空间VQ码本的流程图;图3是VQ码字与GMM模型的依存关系知识的构建图;图4是本专利技术对测试样本(矢量X)进行识别的流程图。具体实施方式以下将结合实施例和附图对本专利技术的构思、具体结构及产生的技术效果进行清楚、完整的描述,以充分地理解本专利技术的目的、特征和效果。显然,所描述的实施例只是本专利技术的一部分实施例,而不是全部实施例,基于本专利技术的本文档来自技高网
...

【技术保护点】
1.一种GMM识别器的快速识别方法,其特征在于,包括以下步骤:步骤1,以待识别的GMM模型中的Gaussian函数中的均值矢量为VQ码本的训练数据,采用无监督聚类方法构建VQ码本;步骤2,构建VQ码本中的VQ码字与GMM模型的依存关系知识;步骤3,待识别的矢量X首先依据邻近原则选择N个VQ码字,利用VQ码字与GMM模型的依存关系知识筛选出待识别的GMM模型,筛选出的GMM模型组成GMM模型子集;步骤4,计算待识别的矢量X与GMM模型子集中各个GMM模型的输出概率,获得待识别矢量X的GMM识别器的识别结果。

【技术特征摘要】
1.一种GMM识别器的快速识别方法,其特征在于,包括以下步骤:步骤1,以待识别的GMM模型中的Gaussian函数中的均值矢量为VQ码本的训练数据,采用无监督聚类方法构建VQ码本;步骤2,构建VQ码本中的VQ码字与GMM模型的依存关系知识;步骤3,待识别的矢量X首先依据邻近原则选择N个VQ码字,利用VQ码字与GMM模型的依存关系知识筛选出待识别的GMM模型,筛选出的GMM模型组成GMM模型子集;步骤4,计算待识别的矢量X与GMM模型子集中各个GMM模型的输出概率,获得待识别矢量X的GMM识别器的识别结果。2.根据权利要求1所述的一种GMM识别器的快速识别方法,其特征在于:步骤1中,各个所述GMM模型的Gaussian函数中的均值矢量共同构成均值矢量集其中n为GMM模型编号,m为GMM模型的Gaussian分量索引;按照Gaussian函数空间邻近聚类原则,采用K均值聚类算法对均值矢量集构建K个VQ码字的VQ码本W={wi,i=1,2,…,K},其中wi表示第i个VQ码字。3.根据权利要求2所述的一种GMM识别器的快速识别方法,其特征在于:步骤2中VQ码本中的VQ码字wi与GMM模型的依存关系知识由该VQ码字wi包含的Gaussian模型分量Gaussian分量权重和以及GMM模型编号构成。4.根据权利要求3所述的一种GMM识别器的快速识别方法...

【专利技术属性】
技术研发人员:周伟力
申请(专利权)人:佛山科学技术学院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1