一种基于未知语料的自学习动态声纹身份验证方法技术

技术编号:33131535 阅读:42 留言:0更新日期:2022-04-17 00:49
本发明专利技术公开了一种基于未知语料的自学习动态声纹身份验证方法,根据注册语料规则格式,接收并处理注册人员的一般注册字符串和少量特殊注册字符串于训练好的各判别器中,构建注册声纹库。根据验证语料规则格式,进行预处理,经前置条件通过后,数字串会基于文本相关识别技术得到第一嵌入码;特殊字串会基于文本无关识别技术得到第二嵌入码,从而查看是否匹配。根据保存于文本相关资料库的累积量、性能提升度、录入语料人数量等因素对文本无关判别器、一般字符串数字串文本相关判别器以及特殊字符串文本相关声纹判别器进行更新。本发明专利技术具有较好的性能,基于未知语料提升安全性,基于模型和数据库动态增加自动提升性能。模型和数据库动态增加自动提升性能。模型和数据库动态增加自动提升性能。

【技术实现步骤摘要】
一种基于未知语料的自学习动态声纹身份验证方法


[0001]本专利技术属于声纹技术的身份验证领域,尤其涉及一种基于未知语料的自学习动态声纹身份验证方法。

技术介绍

[0002]声纹识别是利用人的声纹特征来进行身份认证的生物特征识别技术,具有采集成本低、实现简单、体验性好等优点。更为重要的是,声纹特征是所有生物特征中唯一的低敏感度信息,与人脸识别、指纹识别等其他生物特征识别技术相比,声纹识别涉及的个人隐私信息少,更容易被用户接受。按识别内容可将声纹识别分为文本无关、文本相关和文本提示型三种。然而目前基于这三种识别方案的软件均缺乏反欺诈功能,使得冒充者有可能通过各种手段伪造出和目标说话人接近的语音,从而对声纹识别系统进行欺诈攻击,例如在微信和支付宝推出的声音锁中均存在此类安全隐患。对于文本相关的声纹识别,常用的固定式验证码容易被录音欺诈,即冒充者播放已经录制好的目标用户的声音通过声纹验证。文本提示型的声纹识别虽然具有一定的反欺诈功能,但其受文本集合的限制较大,文本集合太小,则识别系统的安全性不够;文本集合太大,则用户需要录入大量的音频,体验感降低。此外,文本提示型的声纹识别还缺乏反录音拼接欺诈功能,比如将用户对固定输入0

9的数字或者A

Z字母的发音全部采集起来,切割出目标说话人说单个数字或字母的语音并形成文本语音库,在进行声纹确认时,利用计算机程序可以根据文本语音库迅速地拼接出目标验证码的发音。
[0003]因此,亟需提出一种技术,能够在不涉及更多的个人隐私以及不降低用户体验的基础之上,提升了声纹识别系统的安全性,以有效解决在各类软件登录或金融支付过程中基于声纹识别的身份认证方案中的安全性差的问题。

技术实现思路

[0004]本专利技术的技术目的是提供一种基于未知语料的自学习动态声纹身份验证方法,以解决声纹识别安全性差的技术问题。
[0005]为解决上述问题,本专利技术的技术方案为:
[0006]一种基于未知语料的自学习动态声纹身份验证方法,配置有动态声纹身份验证系统,方法包括:
[0007]A1:根据注册语料规则格式,接收并处理注册人员的一般注册字符串和特殊注册字符串于预设的判别器中,构建注册声纹库;其中,预设的判别器包括1个文本无关判别器、1个一般字符串数字串文本相关判别器以及若干个特殊字符串文本相关声纹判别器;
[0008]A2:根据验证语料规则格式,对输入的验证语料进行识别和二元切分,得到一般验证字符串和特殊验证字符串,并经过各自的语音识别引擎识别比对,如通过后,再对一般验证字符串进行预处理并送入一般字符串数字串文本相关判别器,基于文本相关识别技术得到一般字符串数字串文本相关判别器的第一嵌入码;对特殊验证字符串进行预处理,根据
特殊验证字符串是否存在相对应的特殊字符串文本相关声纹判别器以及是否存在至少一条注册嵌入码,送入文本无关判别器或特殊字符串文本相关声纹判别器,基于文本无关识别技术得到文本无关判别器或文本相关声纹判别器的第二嵌入码;
[0009]A3:根据保存于文本相关资料库的一般验证字符串的累积量以及性能提升度同时满足一定阈值,则更新一般字符串数字串文本相关判别器;
[0010]根据特殊验证字符串保存于文本相关资料库中的录入语料人数量及其语料数量同时满足一定阈值,则更新文本相关语料库以及特殊字符串文本相关声纹判别器;
[0011]根据特殊验证字符串保存于文本无关语料库的累积量以及性能提升度同时满足一定阈值,则更新文本无关判别器。
[0012]进一步优选地,在步骤A2验证过程中,还会利用未形成特殊字符串文本相关声纹判别器的词语,根据数据积累量以及性能提升度满足一定阈值后,经数据扩增及鲁棒处理后,具备未形成特殊字符串文本相关声纹判别器训练模型所需的文本相关语料库,其获取方式为通过部分验证人验证时对文本相关语料库进行更新增加,使得录入语料人数量及其语料数量同时满足一定阈值,从而经训练及性能验证生成相对应新的特殊字符串文本相关声纹判别器。
[0013]具体地,步骤A1包括:
[0014]S11:输入一般注册字符串和特殊注册字符串至动态声纹身份验证系统,一般注册字符串和特殊注册字符串分别经一般字符串数字串文本相关判别器和特殊字符串文本相关声纹判别器所形成的前端音频特征实现判别处理,而后存储于文本相关语料库中;
[0015]S12:输入验证语料,对验证语料进行二元切分,得到一般验证字符串和特殊验证字符串,通过文本相关识别技术得到第一嵌入码,第一嵌入码可由一般字符串数字串文本相关判别器提取,基于文本无关识别技术得到第二嵌入码,第二嵌入码可由特殊字符串文本相关声纹判别器提取。
[0016]具体地,步骤A2包括:
[0017]S2:根据动态声纹身份验证系统的动态验证规则,输入动态声纹身份验证系统给出的一动态验证语料,对动态验证语料进行二元切分,得到一般动态验证字符串和特殊动态验证字符串,并分别经过各自的语音识别引擎进行识别比对,若通过后,判断为一般动态验证字符串依次进行语速测试、重新排列以及补齐重建等预处理手段,并进入步骤S3进行后续处理,判断为特殊动态验证字符串则先经过语音识别引擎判断是否同音,若是则再进入步骤S4进入后续处理,其中,一般动态验证字符串由若干数字组成,特殊动态验证字符为中文词语或英文字母或英文词组组成;
[0018]S3:将数字串送入预设的一般字符串数字串文本相关判别器中与预设阈值进行判别,若判别成功,将数字串同时送入文本无关语料库和文本相关资料库进行保存,否则认定为验证失败并停止;
[0019]S4:判断特殊动态验证字符串是否存在相对应的特殊字符串文本相关声纹判别器,以及文本相关语料库是否存在待验证者特殊动态验证字符串的至少1条注册语料,若两者均存在则进入步骤S5,若相对应的特殊字符串文本相关声纹判别器不存在或两者均不存在则进入步骤S6,若相对应的特殊字符串文本相关声纹判别器存在但未激活以及文本相关语料库内至少1条注册语料存在,则进入步骤S7;
[0020]S5:将特殊动态验证字符串送入相对应的特殊字符串文本相关声纹判别器进行相似性判别,若相似性超过预设阈值,则判定成功,将特殊动态验证字符串送入文本无关语料库和文本相关资料库进行保存,否则认定为验证失败并停止;
[0021]S6:将特殊动态验证字符串送入文本无关判别器进行相似性判别,若相似性超过预设阈值,若判定成功,则送入文本无关语料库和文本相关语料库进行保存,否则认定为验证失败并停止;
[0022]S7:将特殊动态验证字符串送入文本无关判别器进行相似性判别,若相似性超过预设阈值,若判定成功,则送入文本无关语料库进行保存,并对文本相关语料库进行后处理,相对应的特殊字符串文本相关声纹判别器被激活,新增至少一条可被所述特殊字符串文本相关声纹判别器判别的注册语料,新增一条用于提取注册码,否则认定为验证失败并停止。
[0023]进一步优选地,在步骤S2中,对动态验证语料进行切分之前还包括本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于未知语料的自学习动态声纹身份验证方法,配置有动态声纹身份验证系统,其特征在于,所述方法包括:A1:根据注册语料规则格式,接收并处理注册人员的一般注册字符串和所述特殊注册字符串于预设的判别器中,构建注册声纹库;其中,预设的判别器包括1个文本无关判别器、1个一般字符串数字串文本相关判别器以及若干个特殊字符串文本相关声纹判别器;A2:根据验证语料规则格式,对输入的验证语料进行识别和二元切分,得到一般验证字符串和特殊验证字符串,并经过各自的语音识别引擎识别比对,如通过后,再对所述一般验证字符串进行预处理并送入所述一般字符串数字串文本相关判别器,基于文本相关识别技术得到所述一般字符串数字串文本相关判别器的第一嵌入码;对所述特殊验证字符串进行预处理,根据特殊验证字符串是否存在相对应的所述特殊字符串文本相关声纹判别器以及是否存在至少一条注册嵌入码,送入所述文本无关判别器或所述特殊字符串文本相关声纹判别器,基于文本无关识别技术得到所述文本无关判别器或所述文本相关声纹判别器的第二嵌入码;A3:根据保存于文本相关资料库的所述一般验证字符串的累积量以及性能提升度同时满足一定阈值,则更新所述一般字符串数字串文本相关判别器;根据所述特殊验证字符串保存于所述文本相关资料库中的录入语料人数量及其语料数量同时满足一定阈值,则更新所述文本相关语料库以及所述特殊字符串文本相关声纹判别器;根据所述特殊验证字符串保存于文本无关语料库的累积量以及性能提升度同时满足一定阈值,则更新所述文本无关判别器。2.根据权利要求1所述的基于未知语料的自学习动态声纹身份验证方法,其特征在于,在所述步骤A2验证过程中,还会利用未形成所述特殊字符串文本相关声纹判别器的词语,根据数据积累量以及性能提升度满足一定阈值后,经数据扩增及鲁棒处理后,具备未形成所述特殊字符串文本相关声纹判别器训练模型所需的文本相关语料库,其获取方式为通过部分验证人验证时对所述文本相关语料库进行更新增加,使得录入语料人数量及其语料数量同时满足一定阈值,从而经训练及性能验证生成相对应新的所述特殊字符串文本相关声纹判别器。3.根据权利要求1所述的基于未知语料的自学习动态声纹身份验证方法,其特征在于,所述步骤A1包括:S11:输入所述一般注册字符串和所述特殊注册字符串至所述动态声纹身份验证系统,所述一般注册字符串和所述特殊注册字符串分别经所述一般字符串数字串文本相关判别器和所述特殊字符串文本相关声纹判别器所形成的前端音频特征实现判别处理,而后存储于所述文本相关语料库中;S12:输入验证语料,对所述验证语料进行二元切分,得到所述一般验证字符串和所述特殊验证字符串,通过文本相关识别技术得到第一嵌入码,所述第一嵌入码可由所述一般字符串数字串文本相关判别器提取,基于文本无关识别技术得到第二嵌入码,所述第二嵌入码可由所述特殊字符串文本相关声纹判别器提取。4.根据权利要求1所述的基于未知语料的自学习动态声纹身份验证方法,其特征在于,所述步骤A2包括:
S2:根据所述动态声纹身份验证系统的动态验证规则,输入所述动态声纹身份验证系统给出的一动态验证语料,对所述动态验证语料进行二元切分,得到一般动态验证字符串和特殊动态验证字符串,并分别经过各自的语音识别引擎进行识别比对,若通过后,判断为所述一般动态验证字符串依次进行语速测试、重新排列以及补齐重建等预处理手段,并进入步骤S3进行后续处理,判断为所述特殊动态验证字符串则先经过语音识别引擎判断是否同音,若是则再进入步骤S4进入后续处理,其中,所述一般动态验证字符串由若干数字组成,所述特殊动态验证字符为中文词语或英文字母或英文词组组成;S3:将所述数字串送入预设的一般字符串数字串文本相关判别器中与预设阈值进行判别,若判别成功,将所述数字串同时送入文本无关语料库和文本相关资料库进行保存;否则认定为验证失败并停止;S4:判断所述特殊动态验证字符串是否存在相对应的所述特殊字符串文本相关声纹判别器,以及所述文本相关语料库是否存在待验证者所述特殊动态验证字符串的至少1条注册语料,若两者均存在则进入步骤S5,若相对应的所述特殊字符串文本相关声纹判别器不存在或两者均不存在则进入步骤S6,若相对应的所述特殊字符串文本相关声纹判别器存在但未激活以及所述文本相关语料库内至少1条注册语料存在,则进入步骤S7;S5:将所述特殊动态验证字符串送入相对应的所述特殊字符串文本相关声纹判别器与待验证者的注册嵌入码进行相似性判别,若相似性超过预设阈值,则判定成功,将所述特殊动态验证字符串送入所述文本无关语料库和所述文本相关资料库进行保存,否则认定为验证失败并停止;S6:将所述特殊动态验证字符串送入所述文本无关判别器与待验证者的注册嵌入码进行相似性判别,若相似性超过预设阈值,若判定成功,则送入所述文本无关语料库和文本相关语料库进行保存,否则认定为验证失败并停止;S7:将所述特殊动态验证字符串送入所述文本无关判别器进行相似性判别,若相似性超过预设阈值,若判定成功,则送入所述文本无关语料库进行保存,并对所述文本相关语料库进行...

【专利技术属性】
技术研发人员:洪峰
申请(专利权)人:中国科学院声学研究所东海研究站
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1