基于稀疏降维的说话人识别方法技术

技术编号：9382485 阅读：166 留言：0更新日期：2013-11-28 00:46

一种基于稀疏降维的说话人识别方法，提取用于训练的语音信号的声学特征作为说话人识别的训练特征，然后通过求解稀疏投影矩阵对用于训练的语音信号的声学特征进行降维，并获得最终稀疏投影矩阵，在完成降维后进行分类器训练，提取待识别的语音信号的声学特征作为说话人识别的待识别特征，利用获得的最终稀疏投影矩阵对待识别的语音信号的声学特征进行稀疏降维处理，最终根据所述分类器训练方法进行分类判决，本发明专利技术通过寻找稀疏降维投影矩阵的解路径实现稀疏降维，使得每个解路径在与其相关的范数参数上获得局部最优，最终实现全局最优，可用于说话人识别、人脸识别、手写体分类、人机交互等多种机器学习领域。

全部详细技术资料下载

【技术实现步骤摘要】

【技术保护点】
一种基于稀疏降维的说话人识别方法，提取用于训练的语音信号的声学特征作为说话人识别的训练特征，然后通过求解稀疏投影矩阵对用于训练的语音信号的声学特征进行降维，并获得最终稀疏投影矩阵，在完成降维后进行分类器训练，提取待识别的语音信号的声学特征作为说话人识别的待识别特征，利用获得的最终稀疏投影矩阵对待识别的语音信号的声学特征进行稀疏降维处理，最终根据所述分类器训练方法进行分类判决，其特征在于，所述求解稀疏投影矩阵方法如下：首先，对解路径进行初始化，即对公式求解：其中P定义为P＝I?D1/2WD?1/2，W为邻接矩阵，D为稀疏水平矩阵，P对应的解x即稀疏投影矩阵，设上式的初始非稀疏解为x0，则有Px0＝λx0，其中λ为特征值，并给定初始化拉格朗日乘数η0＝?λ，初始化权重μ0＝0；假设稀疏投影矩阵x中有n个非零元素，定义主集A为|λx|中的前n个最大非零元素，定义初始从集B为|λx|中除了前n个最大非零元素之外的其他非零元素；然后，通过反复迭代来搜索稀疏降维投影矩阵的最优解路径，具体方法为，在第k次迭代开始时，解路径以当前解xk?1为起点，以步长a沿着▽x＝(xk?xk?1)/a的方向前进，权...

【技术特征摘要】

【专利技术属性】
技术研发人员：杨毅，刘加，
申请(专利权)人：清华大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人