一种基于张量结构及稀疏表示的说话人确认方法及系统技术方案

技术编号：21608986 阅读：16 留言：0更新日期：2019-07-13 19:26

本发明专利技术公开了一种基于张量结构及稀疏表示的说话人确认方法及系统，该方法包括步骤：S1、构建听觉特征张量；S2、将所述听觉特征张量转换成稀疏矩阵；S3、降低所述稀疏矩阵的维度以生成最终的特征向量；S4、基于稀疏表示分类器进行说话人确认。本发明专利技术能够在保留数据的内在结构的基础上，减少计算的复杂度，提高说话人确认效率。

A Speaker Recognition Method and System Based on Tensor Structure and Sparse Representation

全部详细技术资料下载

【技术实现步骤摘要】
一种基于张量结构及稀疏表示的说话人确认方法及系统
本专利技术涉及说话人识别
，尤其涉及一种基于张量结构及稀疏表示的说话人确认方法及系统。
技术介绍
说话人识别的任务是识别说话人。说话人识别可分为说话人辨认和说话人确认两类。对于说话人辨认，就是从多个说话人当中找出正确的说话人，这是一个“多选一”的问题；而说话人确认则是验证这段语音是否是某个说话人说的，是“一对一”的问题。说话人确认是通过对话者语音提取个性特征，建立识别模型，从而对话者的身份进行验证的过程，是说话人识别研究的重要分支。在说话人确认中，有效特征参数的提取和高性能识别模型的建立是关键。支持向量机(SupportVectorMachine，SVM)和高斯混合模型(GaussianMixtureModel，GMM)在该领域获得了成功的应用，二者的相互结合是近几年说话人确认研究的主流方法。然而，现有的支持向量机的方法超向量的维数较高，导致后续处理阶段的计算复杂度较高。在识别算法研究方面，用于数据信号表示和压缩的稀疏表示(SparseRepresentation，SR)算法，由于其在过完备字典中寻找输入样本的最简表示子集的过程具有良好的判别性，成为继SVM和GMM之后模式识别领域研究的热点之一。公开号为CN105845142A的专利公开了一种基于稀疏表示的信道鲁棒说话人确认方法，包括如下步骤：构建说话人的过完备字典Dtar；对测试语音进行身份认证矢量i-vector的提取，得到身份认证向量ωtest；所述身份认证向量ωtest通过所述过完备字典Dtar的稀疏求解，得到稀疏表示向量γtest的关联关系...

【技术保护点】
1.一种基于张量结构及稀疏表示的说话人确认方法，其特征在于，包括步骤：S1、构建听觉特征张量；S2、将所述听觉特征张量转换成稀疏矩阵；S3、降低所述稀疏矩阵的维度以生成最终的特征向量；S4、基于稀疏表示分类器进行说话人确认。

【技术特征摘要】
1.一种基于张量结构及稀疏表示的说话人确认方法，其特征在于，包括步骤：S1、构建听觉特征张量；S2、将所述听觉特征张量转换成稀疏矩阵；S3、降低所述稀疏矩阵的维度以生成最终的特征向量；S4、基于稀疏表示分类器进行说话人确认。2.根据权利要求1所述的说话人确认方法，其特征在于，所述步骤S1包括：通过仿真人耳的听觉系统来处理语音信号得到其功率谱图。3.根据权利要求1所述的说话人确认方法，其特征在于，通过非负张量主成分分析方法将所述听觉特征张量转换成稀疏矩阵。4.根据权利要求1所述的说话人确认方法，其特征在于，通过离散余弦变换降低所述稀疏矩阵的维度。5.根据权利要求4所述的说话人确认方法，其特征在于，所述步骤S4中将提取的特征代替i矢量作为稀疏表示分类器的特征向量。6.一种基于...

【专利技术属性】
技术研发人员：简志华，郭珊，徐剑，金易帆，
申请(专利权)人：杭州电子科技大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人