声纹识别系统的性能检测方法、装置、设备和存储介质制造方法及图纸

技术编号:32215576 阅读:10 留言:0更新日期:2022-02-09 17:21
本申请生物识别以及信息安全技术领域,具体涉及一种声纹识别系统的性能检测方法、装置、设备和存储介质。所述方法包括:从音频数据库中获取多个字符音频,并对该多个字符音频进行拼接处理,得到第一攻击声纹,该字符音频为单个字符对应的音频片段;获取目标用户的声纹特征,基于该声纹特征生成用于模拟该目标用户声音的第二攻击声纹;将该第一攻击声纹和该第二攻击声纹发送至声纹识别系统,得到该声纹识别系统的识别响应;根据该识别响应获取该声纹识别系统的性能检测结果。采用本方法能够检测声纹识别系统防伪性能。声纹识别系统防伪性能。声纹识别系统防伪性能。

【技术实现步骤摘要】
声纹识别系统的性能检测方法、装置、设备和存储介质


[0001]本申请涉及生物识别以及信息安全
,特别是涉及一种声纹识别系统的性能检测方法、装置、设备和存储介质。

技术介绍

[0002]目前,声纹识别系统已经普遍应用在互联网金融的登录、支付等多个业务场景中,声纹识别系统是利用基于声纹识别的身份验证技术对用户身份进行验证,确保交易安全性,但与此同时,针对声纹识别系统的恶意声纹攻击也在逐渐增加,攻击者通过模仿、采集、生成被攻击者的声纹冒充被攻击者的身份,严重影响了声纹识别系统的安全性。因此,需要对声纹识别系统的防伪性能进行检测,为声纹识别系统的安全性提供参考。
[0003]然而,目前,并无关于检测声纹识别系统的防伪性能的检测方法,因此,对声纹识别系统的防伪性能进行检测成为亟需解决的问题。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够检测声纹识别系统防伪性能的声纹识别系统的性能检测方法、装置、设备和存储介质。
[0005]第一方面,提供了一种声纹识别系统的性能检测方法,该方法包括:
[0006]从音频数据库中获取多个字符音频,并对该多个字符音频进行拼接处理,得到第一攻击声纹,该字符音频为单个字符对应的音频片段;获取目标用户的声纹特征,基于该声纹特征生成用于模拟该目标用户声音的第二攻击声纹;将该第一攻击声纹和该第二攻击声纹发送至声纹识别系统,得到该声纹识别系统的识别响应;根据该识别响应获取该声纹识别系统的性能检测结果。
[0007]在其中一个实施例中,该第一攻击声纹包括重放声纹,该从音频数据库中获取多个字符音频,并对该多个字符音频进行拼接处理,得到第一攻击声纹,包括:从该音频数据库中随机获取该多个字符音频,并对随机获取的该多个字符音频进行拼接处理,得到该重放声纹。
[0008]在其中一个实施例中,该第一攻击声纹包括构造声纹,该从音频数据库中获取多个字符音频,并对该多个字符音频进行拼接处理,得到第一攻击声纹,包括:获取攻击文字内容,该攻击文字内容包括多个文字字符;从该音频数据库中获取与各文字字符分别对应的该多个字符音频;按照该攻击文字内容中该多个文字字符的排列顺序对获取到的该多个字符音频进行拼接处理,得到该构造声纹。
[0009]在其中一个实施例中,该方法还包括:采集原始声纹;对该原始声纹进行清洗处理,以去除该原始声纹中的噪声,得到候选声纹;对该候选声纹进行切分处理,得到多个该字符音频;基于该多个字符音频构建该音频数据库。
[0010]在其中一个实施例中,该获取目标用户的声纹特征,基于该声纹特征生成用于模拟该目标用户声音的第二攻击声纹,包括:将该目标用户的声纹输入至特征提取神经网络
中,得到该目标用户的声纹特征向量;将该声纹特征向量与声纹文字进行融合处理,得到梅尔谱;对该梅尔谱进行转化处理,得到该第二攻击声纹。
[0011]在其中一个实施例中,将该目标用户的声纹输入至特征提取神经网络中,得到该目标用户的声纹特征向量,包括:将该目标用户的声纹进行切分处理,得到多个声纹片段,将该多个声纹片段分别输入至特征提取神经网络,得到各声纹片段对应的声纹特征向量,对各声纹片段对应的声纹特征向量取平均值,得到该目标用户的声纹特征向量。
[0012]在其中一个实施例中,将该目标用户的声纹输入至特征提取神经网络中之前,该方法还包括:获取训练样本集,该训练样本集包括样本声纹以及样本声纹对应的声纹标签,该声纹标签用于指示该样本声纹为正常声纹或者恶意声纹;基于该训练样本集训练分类神经网络,该分类神经网络包括特征提取层;将该分类神经网络包括的特征提取层作为该特征提取神经网络。
[0013]在其中一个实施例中,该根据该识别响应获取该声纹识别系统的性能检测结果,包括:若该重放声纹对应的该识别响应成功,则确定该声纹识别系统的性能为第一等级;若该重放声纹对应的该识别响应失败,且,该构造声纹对应的该识别响应成功,则确定该声纹识别系统的性能为第二等级;若该重放声纹对应的该识别响应和该构造声纹对应的该识别响应均成功,且,该第二攻击声纹对应的该识别响应失败,则确定该声纹识别系统的性能为第三等级;若该重放声纹对应的该识别响应、该构造声纹对应的该识别响应以及该第二攻击声纹对应的该识别响应均失败,则确定该声纹识别系统的性能为第四等级;该第一等级、第二等级、第三等级和第四等级表征的声纹识别系统的性能依次递增。
[0014]第二方面,提供了一种声纹识别系统的性能检测装置,该装置包括:
[0015]第一获取模块,用于从音频数据库中获取多个字符音频,并对该多个字符音频进行拼接处理,得到第一攻击声纹,该字符音频为单个字符对应的音频片段;第二获取模块,用于获取目标用户的声纹特征,基于该声纹特征生成用于模拟该目标用户声音的第二攻击声纹;发送模块,用于将该第一攻击声纹和该第二攻击声纹发送至声纹识别系统,得到该声纹识别系统的识别响应;第三获取模块,用于根据该识别响应获取该声纹识别系统的性能检测结果。
[0016]在其中一个实施例中,该第一攻击声纹包括重放声纹,该第一获取模块,具体用于:从该音频数据库中随机获取该多个字符音频,并对随机获取的该多个字符音频进行拼接处理,得到该重放声纹。
[0017]在其中一个实施例中,该第一攻击声纹包括构造声纹,该第一获取模块,具体用于:获取攻击文字内容,该攻击文字内容包括多个文字字符;从该音频数据库中获取与将该文字字符分别对应的该多个字符音频;按照该攻击文字内容中该多个文字字符的排列顺序对获取到的该多个字符音频进行拼接处理,得到该构造声纹。
[0018]在其中一个实施例中,该装置还包括:
[0019]采集模块,用于采集原始声纹;清洗模块,用于对该原始声纹进行清洗处理,以去除该原始声纹中的噪声,得到候选声纹;切分模块,用于对该候选声纹进行切分处理,得到多个该字符音频;构建模块,用于基于该多个字符音频构建该音频数据库。
[0020]在其中一个实施例中,该第二获取模块,具体用于:将该目标用户的声纹输入至特征提取神经网络中,得到该目标用户的声纹特征向量;将该声纹特征向量与声纹文字进行
融合处理,得到梅尔谱;对该梅尔谱进行转化处理,得到该第二攻击声纹。
[0021]在其中一个实施例中,该第二获取模块,具体用于:将该目标用户的声纹进行切分处理,得到多个声纹片段,将该多个声纹片段分别输入至特征提取神经网络,得到将该声纹片段对应的声纹特征向量,对将该声纹片段对应的声纹特征向量取平均值,得到该目标用户的声纹特征向量。
[0022]在其中一个实施例中,该装置还包括:
[0023]第四获取模块,用于获取训练样本集,该训练样本集包括样本声纹以及样本声纹对应的声纹标签,该声纹标签用于指示该样本声纹为正常声纹或者恶意声纹;训练模块,用于基于该训练样本集训练分类神经网络,该分类神经网络包括特征提取层;将该分类神经网络包括的特征提取层作为该特征提取神经网络。
[0024]在其中一个实施例中,该第三获取本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种声纹识别系统的性能检测方法,其特征在于,所述方法包括:从音频数据库中获取多个字符音频,并对所述多个字符音频进行拼接处理,得到第一攻击声纹,所述字符音频为单个字符对应的音频片段;获取目标用户的声纹特征,基于所述声纹特征生成用于模拟所述目标用户声音的第二攻击声纹;将所述第一攻击声纹和所述第二攻击声纹发送至声纹识别系统,得到所述声纹识别系统的识别响应;根据所述识别响应获取所述声纹识别系统的性能检测结果。2.根据权利要求1所述的方法,其特征在于,所述第一攻击声纹包括重放声纹,所述从音频数据库中获取多个字符音频,并对所述多个字符音频进行拼接处理,得到第一攻击声纹,包括:从所述音频数据库中随机获取所述多个字符音频,并对随机获取的所述多个字符音频进行拼接处理,得到所述重放声纹。3.根据权利要求2所述的方法,其特征在于,所述第一攻击声纹包括构造声纹,所述从音频数据库中获取多个字符音频,并对所述多个字符音频进行拼接处理,得到第一攻击声纹,包括:获取攻击文字内容,所述攻击文字内容包括多个文字字符;从所述音频数据库中获取与各所述文字字符分别对应的所述多个字符音频;按照所述攻击文字内容中所述多个文字字符的排列顺序对获取到的所述多个字符音频进行拼接处理,得到所述构造声纹。4.根据权利要求1至3任一所述的方法,其特征在于,所述方法还包括:采集原始声纹;对所述原始声纹进行清洗处理,以去除所述原始声纹中的噪声,得到候选声纹;对所述候选声纹进行切分处理,得到多个所述字符音频;基于所述多个字符音频构建所述音频数据库。5.根据权利要求1所述的方法,其特征在于,所述获取目标用户的声纹特征,基于所述声纹特征生成用于模拟所述目标用户声音的第二攻击声纹,包括:将所述目标用户的声纹输入至特征提取神经网络中,得到所述目标用户的声纹特征向量;将所述目标用户的声纹特征向量与声纹文字进行融合处理,得到梅尔谱;对所述梅尔谱进行转化处理,得到所述第二攻击声纹。6.根据权利要求5所述的方法,其特征在于,所述将所述目标用户的声纹输入至特征提取神经网络中,得到所述目标用户的声纹特征向量,包括:将所述目标用户的声纹进行切分处理,得到多个声纹片段;将所述多个声纹片段分别输入至所述特征提取神经网络,得到各所述声纹片段对应的声纹特征向量;对各所述声纹片...

【专利技术属性】
技术研发人员:汤旭东吕博良
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1