一种基于矩阵离线预计算的快速全空间因子处理方法技术

技术编号:8656491 阅读:312 留言:0更新日期:2013-05-02 00:14
本发明专利技术涉及一种基于矩阵离线预计算的快速全空间因子处理方法,步骤为:资源加载,首先都需要加载通用背景模型(UBM),全空间因子矩阵T;获取需要做声纹验证或者注册的语音数据,并提取声纹识别所需PLP特征;提取零阶统计量N和一阶统计量F;计算并得到L矩阵;生成L矩阵的逆矩阵;利用一阶统计量、L矩阵的逆矩阵、协方差扩展矩阵、全空间因子矩阵得到本次语音对应的全空间因子W;如果完成所有语音计算则结束。本发明专利技术将全空间因子求解模块效率提升了几十倍,使得全空间因子分析与本征信道因子分析算法复杂度相当,从而使得声纹识别中可以采用两者融合的系统。

【技术实现步骤摘要】

本专利技术涉及一种声纹识别系统中语音信号处理的声纹识别技术,特别是。
技术介绍
在声纹识别系统中,如果采用本征信道因子分析与全空间因子分析融合,可以提升声纹识别系统效果。但是在全空间因子分析中,全空间因子求解算法复杂度较高,运算密集;相比于本征信道因子分析,全空间因子分析运算复杂度大了近两个量级,从而制约了其在声纹识别中的推广。下面对名词进行解释: 声纹识别:属于生物识别技术的一种,是一项根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术。.GMM模型:高斯混淆模型(Gaussian Mixture Model)简称GMM模型是指多个高斯模型通过线性叠加而得到的新的模型,在声纹 识别系统中通常采用高斯混淆模型来表示特征的分布。.UBM模型:通用背景模型(Universal Background Model)简称为UBM模型,混合高斯模型的核心是用一些高斯函数去拟合每个人说话时的特征,在训练模型的时候,由于注册时说话人的数据量不够,因此只能由一个通用的背景模型把少量的说话人的数据自适应到目标说话人模型上;在测试时,用测试语音相对于目标说话人模型和UBM模型求对本文档来自技高网...

【技术保护点】
一种基于矩阵离线预计算的快速全空间因子处理方法,其特征在于实现步骤如下:步骤1:资源加载,加载通用背景模型(UBM)、全空间因子矩阵T及离线预计算之后的离线预计算资源,即结果A;资源加载是全局性的,在整个引擎初始化时加载一次即可;全局加载的通用背景模型、全空间因子矩阵、离线预计算资源将在后续步骤陆续被使用;步骤2:获取需要声纹验证或者注册的输入语音数据,并提取声纹识别所需PLP特征;此处输入语音数据是全空间因子分析的对象,通过该步骤能够多次输入语音数据;步骤3:使用步骤1中加载的通用背景模型(UBM),以及步骤2中提取的PLP特征,计算零阶统计量N和一阶统计量F;零阶统计量N在步骤4中用于计算...

【技术特征摘要】
1.一种基于矩阵离线预计算的快速全空间因子处理方法,其特征在于实现步骤如下: 步骤1:资源加载,加载通用背景模型(UBM)、全空间因子矩阵T及离线预计算之后的离线预计算资源,即结果A ;资源加载是全局性的,在整个引擎初始化时加载一次即可;全局加载的通用背景模型、全空间因子矩阵、离线预计算资源将在后续步骤陆续被使用; 步骤2:获取需要声纹验证或者注册的输入语音数据,并提取声纹识别所需PLP特征;此处输入语音数据是全空间因子分析的对象,通过该步骤能够多次输入语音数据; 步骤3:使用步骤I中加载的通用背景模型(UB...

【专利技术属性】
技术研发人员:雷琴辉赵彬赵敏志于超敏赵志伟卢小亭王丹吴晓如
申请(专利权)人:安徽科大讯飞信息科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术