【技术实现步骤摘要】
本专利技术涉及语种识别领域,尤其涉及一种基于共有鉴别性子空间映射的语种识别方法及装置。
技术介绍
语种识别技术的目的在于日后能够制造一种能够在一定程度上模仿人的思维对语种进行自动辨识的机器。换言之,就是从语音信号中提取出各语种的差异信息,并以此作为依据对语种进行识别。在实际应用中,由于环境噪声以及信道干扰等的影响,使识别性能急剧下降,对识别鲁棒性提出了较大的挑战。因此,如何提高语种识别的鲁棒性,减弱或者去除语音信号中的环境噪声与信道干扰等的负面影响,是当前语种识别研究的一个热点。高斯混合模型-支持向量机(GMM-SVM)的方法通过将高斯超向量的思想引入语种识别,在语种识别中得到了成功的应用。实验表明,高斯超向量可以有效表征一段语音数据。但是,由于高斯超向量具有较高的维数,在语种种类比较多,数据量大的情况下可能会遇到机器内存不足,支持向量机模型训练速度慢甚至训练不出的情况。因此,对高斯超向量寻找有效的降维方法是当前研究的重点。
技术实现思路
本专利技术的目的是提供一种能够克服至少上述缺陷之一的基于共有鉴别性子空间映射的语种识别方法及装置。在本专利技术的第一方面,提供了 ...
【技术保护点】
一种基于共有鉴别性子空间映射的语种识别方法,包括:提取一个语种的多个语音数据的语音特征;根据所述语音特征得到所述多个语音数据的高斯超向量,其中,每个语音数据对应一组高斯超向量;将所述高斯超向量映射到共有鉴别性子空间,得到与所述高斯超向量对应的低维向量,其中,所述共有鉴别性子空间是预先用多个语种的语音数据建立的;以及分别计算所述低维向量在多个支持向量机SVM模型上的得分,根据多个得分识别出所述语种,其中,所述多个SVM模型是预先根据所述共有鉴别性子空间训练出来的,每个SVM模型对应一个语种。
【技术特征摘要】
1.一种基于共有鉴别性子空间映射的语种识别方法,包括: 提取一个语种的多个语音数据的语音特征; 根据所述语音特征得到所述多个语音数据的高斯超向量,其中,每个语音数据对应一组高斯超向量; 将所述高斯超向量映射到共有鉴别性子空间,得到与所述高斯超向量对应的低维向量,其中,所述共有鉴别性子空间是预先用多个语种的语音数据建立的;以及 分别计算所述低维向量在多个支持向量机SVM模型上的得分,根据多个得分识别出所述语种,其中,所述多个SVM模型是预先根据所述共有鉴别性子空间训练出来的,每个SVM模型对应一个语种。2.根据权利要求1所述的方法,其中,所述根据所述语音特征得到所述多个语音数据的高斯超向量的步骤包括: 通过最大后验概率MAP从高斯混合模型GMM得到所述语音数据的高斯分布均值,所述GMM是预先用多个语种的语音数据建立的;以及 将所述高斯分布均值按顺序排列得到所述高斯超向量。3.根据权利要求1所述的方法,其中,所述共有鉴别性子空间是通过下列步骤得到的: 提取多个语种的多个语音数据的语音特征; 根据所述语音特征得到每个语音数据的高斯超向量; 计算每个语种的高斯超向量均值; 根据所述高斯超向量得到每个语种的标准正交基; 将每个语种的高斯超向量均值分别映射到其他多个语种的标准正交基上,得到每个语种对应于其他语种的冗余向量; 根据所述冗余向量和每个语种的高斯超向量得到共有向量集;以及 根据所述共有向量集得到所述共有鉴别性子空间。4.根据权利要求3所述的方法,其中,所述多个SVM模型的训练包括下列步骤: 将每个语音数据的高斯超向量映射到所述共有鉴别性子空间,得到与所述高斯超向量对应的低维向量;以及 用支持向量机SVM分类器训练所述低维向量,得到所述多个SVM模型。5.根据权利要求3所述的方法,其中,所述根据所述MSDC特征得到每个语音数据的高斯超向量的步骤包括: 根据所述语音特征训练出高斯混合模型G...
【专利技术属性】
技术研发人员:周若华,颜永红,王宪亮,刘建,
申请(专利权)人:中国科学院声学研究所,北京中科信利技术有限公司,
类型:发明
国别省市: