一种改进的基于总变化量因子的语种识别方法及系统技术方案

技术编号：35187524 阅读：27 留言：0更新日期：2022-10-12 17:59

本发明专利技术提供了一种改进的基于总变化量因子的语种识别方法及系统，包括S1：获取若干语种的特征数据；S2：利用各目标语种的训练特征数据，获得目标语种对应的全局背景模型，进行均值拼接后得到背景高斯超向量；S3：根据全局背景模型，通过自适应算法，获取特征数据对应目标语种先验的高斯超向量；S4：进行总变化量因子分析，获得语音数据基于目标语种先验的总变化量因子向量；S5：拼接总变化量因子向量，得到每条语音数据对应的多重总变化量因子向量；S6：构建SVM分类识别模型，基于多重总变化量因子向量进行语种识别。本发明专利技术基于不同语种先验的全局背景模型，获得语音数据的多重总变化量因子进行语种识别，提升了语种识别的准确性。提升了语种识别的准确性。提升了语种识别的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种改进的基于总变化量因子的语种识别方法及系统

[0001]本专利技术涉及语音识别
，特别涉及一种改进的基于总变化量因子的语种识别方法及系统。

技术介绍

[0002]和大多数统计模式分类问题一样，语种识别技术也分为两大模块:训练模块和识别模块。在训练模块，训练语音数据通过必要的处理，然后进行特征提取，根据所提特征建立语种模型。在识别模块，待识别语音数据经过同样地处理，并提取特征，所提特征与训练模块得到的语种模型进行匹配，这个匹配过程通常称为“打分”过程，得到的分数一般要经过一个得分后处理的过程，最终给出语种判决，一般把得分后处理和最后做出语种判决的过程称为“打分决策”过程。对于一个典型的语种识别系统来说，主要包括特征提取，模型训练，打分决策三个过程。
[0003]基于高斯超向量的语种识别方法是一种被广泛使用的语种识别方法，其中有代表性的就是基于总变化量因子的语种识别方法，总变化量因子是对高维高斯超向量的一种低维表示。该方式的具体过程为，语音数据经声学层特征提取，基于全局背景模型(UBM)自适应估计得到该语音对应的高斯混合模型，将高斯混合模型的均值拼接就得到高斯超向量，一般认为这个高斯超向量包含了语音的语种信息，高斯超向量作为表征语音信息的特征向量将语音特征从声学空间转换到高斯超向量空间，一段语音无论语音帧数的多少都变换为固定长度N的高斯超向量，从而更有利于模式识别方法用于语种识别。
[0004]以总变化量因子向量作为语种识别的特征，自然的，通用的支持向量机分类器就通过对总变化量因子向量的建模引入...

【技术保护点】

【技术特征摘要】
1.一种改进的基于总变化量因子的语种识别方法，其特征在于，包括：S1：获取若干语种信息的语音数据，包括基于已知语种信息获取的语音训练数据和基于未知语种信息获取的语音测试数据，并进行声学层特征提取，获得各目标语种对应的若干特征数据；S2：利用各目标语种用于训练的特征数据，分别训练获得与目标语种对应的全局背景模型，对所述目标语种对应的全局背景模型进行均值拼接，获得所述目标语种对应的背景高斯超向量；S3：每条特征数据和任一所述目标语种对应的全局背景模型，通过自适应算法，获取每条特征数据对应任一所述目标语种先验的高斯超向量；S4：通过每条特征数据对应任一所述目标语种的高斯超向量和各目标语种用于训练的特征数据对应任一所述目标语种的背景高斯超向量，进行相应的总变化量因子分析，获得每条语音数据基于该所述目标语种先验的总变化量因子向量；S5：按照步骤S3、S4所述方法，获取每条语音数据基于所有目标语种先验的总变化量因子向量w
i
，对所有目标语种先验的总变化量因子向量进行拼接，获得每条语音数据对应的多重总变化量因子向量；S6：构建SVM分类识别模型，基于多重总变化量因子向量进行语种识别。2.根据权利要求1所述的语种识别方法，其特征在于，步骤S2中，通过最大似然估计法训练各目标语种对应的所述全局背景模型。3.根据权利要求1所述的语种识别方法，其特征在于，步骤S3中，具体过程如下：S301：任一语音特征数据，通过该语音特征数据与所述目标语种对应的全局背景模型，基于自适应算法，获得GMM模型；S302：对GMM模型进行均值拼接，获得高斯超向量。4.根据权利要求1所述的语种识别方法，其特征在于，步骤S6中，具体过程如下：S601：获取任意语音数据对应的多重总变化量因子，即获取每条训练数据对应的多重总变化量因子，获取每条测试数据对应的多重总变化量因子；S602：通过已知语种...

【专利技术属性】
技术研发人员：杨金超，
申请(专利权)人：中国电子科技集团公司第二十九研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人