一种改进的基于总变化量因子的语种识别方法及系统技术方案

技术编号:35187524 阅读:27 留言:0更新日期:2022-10-12 17:59
本发明专利技术提供了一种改进的基于总变化量因子的语种识别方法及系统,包括S1:获取若干语种的特征数据;S2:利用各目标语种的训练特征数据,获得目标语种对应的全局背景模型,进行均值拼接后得到背景高斯超向量;S3:根据全局背景模型,通过自适应算法,获取特征数据对应目标语种先验的高斯超向量;S4:进行总变化量因子分析,获得语音数据基于目标语种先验的总变化量因子向量;S5:拼接总变化量因子向量,得到每条语音数据对应的多重总变化量因子向量;S6:构建SVM分类识别模型,基于多重总变化量因子向量进行语种识别。本发明专利技术基于不同语种先验的全局背景模型,获得语音数据的多重总变化量因子进行语种识别,提升了语种识别的准确性。提升了语种识别的准确性。提升了语种识别的准确性。

【技术实现步骤摘要】
一种改进的基于总变化量因子的语种识别方法及系统


[0001]本专利技术涉及语音识别
,特别涉及一种改进的基于总变化量因子的语种识别方法及系统。

技术介绍

[0002]和大多数统计模式分类问题一样,语种识别技术也分为两大模块:训练模块和识别模块。在训练模块,训练语音数据通过必要的处理,然后进行特征提取,根据所提特征建立语种模型。在识别模块,待识别语音数据经过同样地处理,并提取特征,所提特征与训练模块得到的语种模型进行匹配,这个匹配过程通常称为“打分”过程,得到的分数一般要经过一个得分后处理的过程,最终给出语种判决,一般把得分后处理和最后做出语种判决的过程称为“打分决策”过程。对于一个典型的语种识别系统来说,主要包括特征提取,模型训练,打分决策三个过程。
[0003]基于高斯超向量的语种识别方法是一种被广泛使用的语种识别方法,其中有代表性的就是基于总变化量因子的语种识别方法,总变化量因子是对高维高斯超向量的一种低维表示。该方式的具体过程为,语音数据经声学层特征提取,基于全局背景模型(UBM)自适应估计得到该语音对应的高斯混合模型,将高斯混合模型的均值拼接就得到高斯超向量,一般认为这个高斯超向量包含了语音的语种信息,高斯超向量作为表征语音信息的特征向量将语音特征从声学空间转换到高斯超向量空间,一段语音无论语音帧数的多少都变换为固定长度N的高斯超向量,从而更有利于模式识别方法用于语种识别。
[0004]以总变化量因子向量作为语种识别的特征,自然的,通用的支持向量机分类器就通过对总变化量因子向量的建模引入语种识别,这就是语种识别的一种基本方法“总变化量因子

支持向量机”语种识别方法,具体的,将训练语音和测试语音的声学特征转换为总变化量因子向量,并进行预处理,之后将训练语音对应处理得到的训练数据输入到语种SVM模型中,进行训练,基于模型输出和测试语音对应处理得到的测试数据,通过SVM进行打分,最后进行打分决策,输出语种识别结果。
[0005]随着语种识别技术的发展,在实际中对语种识别也有了更高的性能要求,上述现有的语种识别方法在识别精确度上仍有不足。

技术实现思路

[0006]为解决上述问题,本专利技术提供了一种改进的基于总变化量因子的语种识别方法及系统,通过获取多个目标语种的语音数据,基于最大似然估计获得对应的全局背景模型,获得对应的背景高斯超向量,做相应的总变化量因子分析,得到不同目标语种先验的总变化量因子向量,并进行拼接,得到多重总变化量因子向量,基于多重总变化量因子进行语音识别,提升基于总变化量因子语种识别的准确性。
[0007]本专利技术提供了一种改进的基于总变化量因子的语种识别方法,包括:
[0008]S1:获取若干语种信息的语音数据,包括基于已知语种信息获取的语音训练数据
和基于未知语种信息获取的语音测试数据,并进行声学层特征提取,获得各目标语种对应的若干特征数据;
[0009]S2:利用各目标语种用于训练的特征数据,分别训练获得与目标语种对应的全局背景模型,对所述目标语种对应的全局背景模型进行均值拼接,获得所述目标语种对应的背景高斯超向量;
[0010]S3:每条特征数据和任一所述目标语种对应的全局背景模型,通过自适应算法,获取每条语音数据对应任一所述目标语种先验的高斯超向量;
[0011]S4:通过每条特征数据对应任一所述目标语种的高斯超向量和各目标语种用于训练的特征数据对应任一所述目标语种的背景高斯超向量,进行相应的总变化量因子分析,获得每条语音数据基于该所述目标语种先验的总变化量因子向量;
[0012]S5:按照步骤S3、S4所述方法,获取每条语音数据基于所有目标语种先验的总变化量因子向量w
i
,对所有目标语种先验的总变化量因子向量进行拼接,获得每条语音数据对应的多重总变化量因子向量;
[0013]S6:构建SVM分类识别模型,基于多重总变化量因子向量进行语种识别。
[0014]进一步的,在步骤S2中,通过最大似然估计法训练各目标语种对应的所述全局背景模型。
[0015]进一步的,步骤S3中,具体过程如下:
[0016]S301:任一语音特征数据,通过该语音特征数据与任一所述目标语种对应的全局背景模型,基于自适应算法,获得GMM模型;
[0017]S302:对GMM模型进行均值拼接,获得高斯超向量。
[0018]进一步的,步骤S6中,具体过程如下:
[0019]构建SVM分类识别模型,基于多重总变化量因子向量进行语种识别。
[0020]S601:获取任意语音数据对应的多重总变化量因子,即获取每条训练数据对应的多重总变化量因子,获取每条测试数据对应的多重总变化量因子;
[0021]S602:通过已知语种信息的若干多重总变化量因子构建语种SVM模型,将未知语种信息的测试数据对应的包含语种鉴别性信息的多重总变化量因子向量输入到模型中,获得分值结果;
[0022]S603:将分值结果输入到分类模型中,根据分类模型输出结果进行语种判决。
[0023]进一步的,步骤S5中,将所有目标语种先验的总变化量因子向量w
i
进行拼接,拼接成L*N维的多重总变化量因子向量,具体表示如下:
[0024]w
mutil
=[w1,w2,

,w
i
,

,w
L
][0025]其中,w
mutil
表示多重总变化量因子向量,w
i
表示每条语音基于当前目标语种先验的总变化量因子向量。
[0026]本专利技术提供了一种改进的基于总变化量因子的语种识别系统,具体技术方案如下:
[0027]包括语音数据模块、声学层特征提取模块、语种背景模型模块、多重总变化量因子分析模块,SVM分类识别模块;
[0028]所述语音数据模块用于采集获取若干不同语种的语音数据,已知语种信息的语音训练数据进行分类存储,未知语种信息的语种测试数据供后续分类识别;
[0029]所述声学层特征提取模块与所述语音数据模块数据连接,接收语音数据,并进行特征提取;
[0030]所述语种背景模型模块与所述声学层特征提取模块数据连接,接收已知语种信息语音特征数据,获取目标语种对应的全局背景模型,并进行均值拼接获得各目标语种对应的背景高斯超向量;
[0031]所述多重总变化量因子分析模块接收语音特征数据、各目标语种对应的全局背景模型和背景高斯超向量,获取高斯超向量,并进行总变化量因子分析,获得总变化量因子向量,并进行拼接,得到多重总变化量因子向量;
[0032]所述SVM分类识别模块存储有通过训练得到的语种SVM模型和分类模型,接收测试语音数据的多重总变化量因子向量,进行SVM分类识别。
[0033]本专利技术的有益效果如下:
[0034]在传统语种识别的基础上,将基于总变化量因子的语种识别与不同本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种改进的基于总变化量因子的语种识别方法,其特征在于,包括:S1:获取若干语种信息的语音数据,包括基于已知语种信息获取的语音训练数据和基于未知语种信息获取的语音测试数据,并进行声学层特征提取,获得各目标语种对应的若干特征数据;S2:利用各目标语种用于训练的特征数据,分别训练获得与目标语种对应的全局背景模型,对所述目标语种对应的全局背景模型进行均值拼接,获得所述目标语种对应的背景高斯超向量;S3:每条特征数据和任一所述目标语种对应的全局背景模型,通过自适应算法,获取每条特征数据对应任一所述目标语种先验的高斯超向量;S4:通过每条特征数据对应任一所述目标语种的高斯超向量和各目标语种用于训练的特征数据对应任一所述目标语种的背景高斯超向量,进行相应的总变化量因子分析,获得每条语音数据基于该所述目标语种先验的总变化量因子向量;S5:按照步骤S3、S4所述方法,获取每条语音数据基于所有目标语种先验的总变化量因子向量w
i
,对所有目标语种先验的总变化量因子向量进行拼接,获得每条语音数据对应的多重总变化量因子向量;S6:构建SVM分类识别模型,基于多重总变化量因子向量进行语种识别。2.根据权利要求1所述的语种识别方法,其特征在于,步骤S2中,通过最大似然估计法训练各目标语种对应的所述全局背景模型。3.根据权利要求1所述的语种识别方法,其特征在于,步骤S3中,具体过程如下:S301:任一语音特征数据,通过该语音特征数据与所述目标语种对应的全局背景模型,基于自适应算法,获得GMM模型;S302:对GMM模型进行均值拼接,获得高斯超向量。4.根据权利要求1所述的语种识别方法,其特征在于,步骤S6中,具体过程如下:S601:获取任意语音数据对应的多重总变化量因子,即获取每条训练数据对应的多重总变化量因子,获取每条测试数据对应的多重总变化量因子;S602:通过已知语种...

【专利技术属性】
技术研发人员:杨金超
申请(专利权)人:中国电子科技集团公司第二十九研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1