一种基于音素信息的声纹认证系统及方法技术方案

技术编号：14756281 阅读：183 留言：0更新日期：2017-03-02 22:39

本发明专利技术公开了一种基于音素信息的声纹认证系统及方法，系统包括基于汉语普通话语音识别器的音素强制对齐模块、音素相关的模型创建模块和基于dropout策略的神经网络分类器模块；方法包括定义汉语普通话数字串声纹的十六个音素类别，显式利用数字串的各个发音类别信息；基于汉语普通话语音识别器，采用维特比强制对齐算法获取每个对应数字串文本内容的音素边界；采用文本无关算法建立音素相关模型；计算音素相关模型，得到分数向量。本发明专利技术的有益效果：本发明专利技术在实现音素信息切分、音素建模和音素相关模型区分能力分析的同时，提出了采用dropout策略的神经网络训练方法，解决了数字串音素缺失的问题，并提高了数字串声纹认证系统的性能。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及声纹认证系统
，具体来说，涉及一种基于音素信息的声纹认证系统及方法。
技术介绍
生物特征识别是一种根据人体自身所固有的生理特征和行为特征来识别身份的技术,具有不易遗忘、防伪性能好、不易伪造或被盗、随身具备和随时随地可用等优点。随着互联网快速发展，传统身份认证技术手段越来越无法满足用户使用体验和安全能力的需求。简单易用的声纹识别技术，由于其阔的应用前景、巨大的社会效益和经济效益，已引起各行各业的广泛关注和高度重视。声纹识别，又称说话人识别，是生物识别技术的一种。该技术通过语音波形中反映说话人生理和行为特征的语音参数，进而分辨出说话人身份。具有安全性高、数据采集方便等特点。近年来，文本相关(Text-dependent)的说话人识别成为用户认证领域的热点。由于文本无关(Text-independent)说话人识别领域的重大进展，很多研究人员尝试将文本无关说话人识别算法应用到文本相关领域，例如数字串声纹识别。在数字串认证条件下，有研究人员使用联合因子分析(JointFactorAnalysis，JFA)、高斯混合模型-干扰属性映射(GaussianMixtureModel-NuisanceAttributeProjection,GMM-NAP)和隐马尔科夫模型-干扰属性映射(HiddenMarkovModel-NuisanceAttributeProjection,HMM-NAP)进行比较。相比JFA而言，基于NAP的算法表现更好，原因在于训练JFA需要大量的带标记数据，而JFA矩阵的训练数据和数字串测试数据之间存在失配。在文本无关说话人识...
一种基于音素信息的声纹认证系统及方法

【技术保护点】
一种基于音素信息的声纹认证系统，其特征在于，包括基于汉语普通话语音识别器的音素强制对齐模块、音素相关的模型创建模块和基于dropout策略的神经网络分类器模块；所述基于汉语普通话语音识别器的音素强制对齐模块用于对数字串的十六个音素类别进行切分；所述音素相关的模型创建模块用于建立音素相关模型，并分析每个音素相关模型对声纹认证的区分能力；所述基于dropout策略的神经网络分类器模块用于融合音素相关模型的互补信息。

【技术特征摘要】
1.一种基于音素信息的声纹认证系统，其特征在于，包括基于汉语普通话语音识别器的音素强制对齐模块、音素相关的模型创建模块和基于dropout策略的神经网络分类器模块；所述基于汉语普通话语音识别器的音素强制对齐模块用于对数字串的十六个音素类别进行切分；所述音素相关的模型创建模块用于建立音素相关模型，并分析每个音素相关模型对声纹认证的区分能力；所述基于dropout策略的神经网络分类器模块用于融合音素相关模型的互补信息。2.一种基于音素信息的声纹认证方法，其特征在于...

【专利技术属性】
技术研发人员：郑榕，张策，王黎明，
申请(专利权)人：北京远鉴科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人