伪随机声纹密码文本生成方法及系统技术方案

技术编号:13798753 阅读:71 留言:0更新日期:2016-10-06 23:45
本发明专利技术公开了一种伪随机声纹密码文本生成方法及系统,该方法包括:在用户注册阶段生成一个或多个注册声纹密码文本;将所述多个注册声纹密码文本进行拆分,并将拆分后得到的所有声纹密码子文本作为注册声纹密码子文本集合;从所述注册声纹密码子文本集合中选择声纹密码子文本;将选择的声纹密码子文本组合后作为所述用户认证时的声纹密码文本。利用本发明专利技术,可以提升声纹认证的准确度。

【技术实现步骤摘要】

本专利技术涉及声纹认证
,具体涉及一种伪随机声纹密码文本生成方法及系统
技术介绍
随着信息技术的迅猛发展,通信以及网络的全球覆盖使得信息公开化成为历史必然,伴随着信息透明化,个人隐私的安全性也受到了极大的威胁,如何正确地进行个人身份的识别进而保护私人数据是现代社会需要重点关注的方向之一。声纹作为个人身份相关性很高的生物特征已被应用到身份认证领域中,并且声纹密码认证可以利用密码文本和声纹特征两种加密手段进行加密,具有较强的安全保障,得到了社会广泛的关注和应用。现有的声纹密码生成方法一般分为以下两种:1)固定密码文本,即在用户的注册阶段和认证阶段使用相同的密码文本,如“芝麻开门”,在注册阶段让用户朗读多遍“芝麻开门”完成声纹模型训练数据录制,在认证阶段直接让用户朗读注册时密码文本,进行声纹密码认证。2)随机密码文本,即在用户注册阶段和认证阶段的密码文本都是系统随机产生的。上述第1)种固定密码文本,由于密码文本的公开化,容易被冒认者利用目标说话人录音进行冒认。上述第2)种随机密码文本的随机性,经常会出现一些区分性较差的字符作为密码文本,如‘555’,进行声纹认证时,由于‘5’的发音过于低沉,相对于其它字符文本,较难将冒认说话人和目标说话人区分开,从而降低认证效果。另外,现有方法在声纹认证时,由于经常会存在一些字符组合的发音很难完全切分开的现象,如零声母的字符组合‘25’,在声纹模型建模时,容易混入难切分字符的语音,导致模型训练不准确,认证准确度下降,如对字符‘2’
进行声纹模型训练时,训练数据中含有字符‘5’的语音。
技术实现思路
本专利技术实施例提供一种伪随机声纹密码文本生成方法及系统,以提升声纹认证的准确度。为此,本专利技术实施例提供如下技术方案:一种伪随机声纹密码文本生成方法,包括:在用户注册阶段生成一个或多个注册声纹密码文本;将所述注册声纹密码文本进行拆分,并将拆分后得到的所有声纹密码子文本作为注册声纹密码子文本集合;从所述注册声纹密码子文本集合中选择声纹密码子文本;将选择的声纹密码子文本组合后作为所述用户认证时的声纹密码文本。优选地,所述在用户注册阶段生成一个或多个注册声纹密码文本包括:在用户注册阶段随机生成一个或多个注册声纹密码文本。优选地,所述方法还包括:确定各声纹密码文本字符的说话人区分性能;选择说话人区分性能满足要求的字符构建声纹密码文本候选字符集;所述在用户注册阶段生成一个或多个注册声纹密码文本包括:在用户注册阶段从所述声纹密码文本候选字符集中挑选字符生成一个或多个注册声纹密码文本。优选地,所述确定各字符的说话人区分性能包括:收集各声纹密码文本字符的语音数据;利用所述语音数据训练所述字符的声纹模型;将所述字符作为声纹密码文本进行目标说话人和冒认说话人声纹认证,并根据认证结果确定所述字符的说话人区分性能。优选地,所述说话人区分性能指标包括以下任意一种或多种组合:等错误率、识别正确率、检测代价。优选地,所述将所述注册声纹密码文本进行拆分包括:对每个注册声纹密码文本,依次以其各字符为拆分的起始单位,按照设定
的子文本的字符数进行拆分。优选地,对选择的声纹密码子文本进行依序组合或任意组合。优选地,所述方法还包括:在从所述注册声纹密码子文本集合中选择声纹密码子文本之前,删除所述注册声纹密码子文本集合中的重复声纹密码子文本。一种伪随机声纹密码文本生成系统,包括:注册声纹密码文本生成模块,用于在用户注册阶段生成一个或多个注册声纹密码文本;拆分模块,用于将所述多个注册声纹密码文本进行拆分,并将拆分后得到的所有声纹密码子文本作为注册声纹密码子文本集合;选择模块,用于从所述注册声纹密码子文本集合中选择声纹密码子文本;认证声纹密码文本生成模块,用于将选择的声纹密码子文本组合后作为所述用户认证时的声纹密码文本。优选地,所述注册声纹密码文本生成模块,具体用于在用户注册阶段随机生成一个或多个注册声纹密码文本。优选地,所述系统还包括:区分性能确定模块,用于确定各声纹密码文本字符的说话人区分性能;候选字符集生成模块,用于选择说话人区分性能满足要求的字符构建声纹密码文本候选字符集;所述注册声纹密码文本生成模块,具体用于在用户注册阶段从所述声纹密码文本候选字符集中挑选字符生成一个或多个注册声纹密码文本。优选地,所述区分性能确定模块包括:语音数据获取单元,用于收集各声纹密码文本字符的语音数据;训练单元,用于利用所述语音数据训练所述字符的声纹模型;认证确定单元,用于将所述字符作为声纹密码文本进行目标说话人和冒认说话人声纹认证,并根据认证结果确定所述字符的说话人区分性能。优选地,所述拆分模块,具体用于对每个注册声纹密码文本,依次以其各字符为拆分的起始单位,按照设定的子文本的字符数进行拆分。优选地,所述认证声纹密码文本生成模块对所述选择模块选择的声纹密码
子文本进行依序组合或任意组合。优选地,所述系统还包括:整理模块,用于在所述选择模块从所述注册声纹密码子文本集合中选择声纹密码子文本之前,删除所述注册声纹密码子文本集合中的重复声纹密码子文本。本专利技术实施例提供的伪随机声纹密码文本生成方法及系统,在用户注册阶段生成一个或多个声纹密码文本,对注册阶段的声纹密码文本进行拆分;在用户认证阶段,利用拆分后的子文本组合生成认证阶段的声纹密码文本,在保证认证阶段的声纹密码文本具有随机性的同时,使其相邻字符大部分来自注册阶段的声纹密码文本,从而可以有效利用用户的协同发音特性(即用户在读一些连续文本时,在发音上表现出的不同特性)进行声纹认证,提升声纹密码认证的准确度。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。图1是本专利技术实施例伪随机声纹密码文本生成方法的流程图;图2是本专利技术实施例中生成注册声纹密码文本的一种流程图;图3是本专利技术实施例伪随机声纹密码文本生成系统的一种结构示意图;图4是本专利技术实施例伪随机声纹密码文本生成系统的另一种结构示意图。具体实施方式为了使本
的人员更好地理解本专利技术实施例的方案,下面结合附图和实施方式对本专利技术实施例作进一步的详细说明。如图1所示,是本专利技术实施例伪随机声纹密码文本生成方法的流程图,包括以下步骤:步骤101,在用户注册阶段生成一个或多个注册声纹密码文本。具体地,可以随机生成一个或多个(比如3个、5个等)注册声纹密码文
本,这些注册声纹密码文本的长度可以相同,也可以不同。让用户朗读这些声纹密码文本,录制用户朗读这些声纹密码文本的语音数据,利用这些语音数据完成声纹模型训练,以便在认证阶段利用该声纹模型对用户进行声纹认证。当然,还可以有其它方式生成注册声纹密码文本,具体将在后面详细描述。步骤102,将所述注册声纹密码文本进行拆分,并将拆分后得到的所有声纹密码子文本作为注册声纹密码子文本集合。具体地,对每个注册声纹密码文本,依次以其各字符为拆分的起始单位,按照设定的子文本的字符数进行拆分。比如,确定子文本的字符数(即生成认证阶段声纹密码文本时,使用注册阶段声纹密码文本中相邻的字符数)为s;选中一本文档来自技高网
...

【技术保护点】
一种伪随机声纹密码文本生成方法,其特征在于,包括:在用户注册阶段生成一个或多个注册声纹密码文本;将所述注册声纹密码文本进行拆分,并将拆分后得到的所有声纹密码子文本作为注册声纹密码子文本集合;从所述注册声纹密码子文本集合中选择声纹密码子文本;将选择的声纹密码子文本组合后作为所述用户认证时的声纹密码文本。

【技术特征摘要】
1.一种伪随机声纹密码文本生成方法,其特征在于,包括:在用户注册阶段生成一个或多个注册声纹密码文本;将所述注册声纹密码文本进行拆分,并将拆分后得到的所有声纹密码子文本作为注册声纹密码子文本集合;从所述注册声纹密码子文本集合中选择声纹密码子文本;将选择的声纹密码子文本组合后作为所述用户认证时的声纹密码文本。2.根据权利要求1所述的方法,其特征在于,所述在用户注册阶段生成一个或多个注册声纹密码文本包括:在用户注册阶段随机生成一个或多个注册声纹密码文本。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:确定各声纹密码文本字符的说话人区分性能;选择说话人区分性能满足要求的字符构建声纹密码文本候选字符集;所述在用户注册阶段生成一个或多个注册声纹密码文本包括:在用户注册阶段从所述声纹密码文本候选字符集中挑选字符生成一个或多个注册声纹密码文本。4.根据权利要求3所述的方法,其特征在于,所述确定各字符的说话人区分性能包括:收集各声纹密码文本字符的语音数据;利用所述语音数据训练所述字符的声纹模型;将所述字符作为声纹密码文本进行目标说话人和冒认说话人声纹认证,并根据认证结果确定所述字符的说话人区分性能。5.根据权利要求3所述的方法,其特征在于,所述说话人区分性能指标包括以下任意一种或多种组合:等错误率、识别正确率、检测代价。6.根据权利要求1所述的方法,其特征在于,所述将所述注册声纹密码文本进行拆分包括:对每个注册声纹密码文本,依次以其各字符为拆分的起始单位,按照设定的子文本的字符数进行拆分。7.根据权利要求1所述的方法,其特征在于,对选择的声纹密码子文本进行依序组合或任意组合。8.根据权利要求1至7任一项所述的方法,其特征在于,所述方法还包括:在从所述注册声纹密码子文本集合中选择声纹密码子文本之前,删除所述注册声纹密码子文本集合中的重复声纹密码子文本。9.一种伪随机声纹密码文本生成系统,其特征在...

【专利技术属性】
技术研发人员:方昕刘俊华魏思胡国平王影胡郁刘庆峰
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1