当前位置: 首页 > 专利查询>清华大学专利>正文

语音验证装置的安全性测试方法及装置制造方法及图纸

技术编号:35404436 阅读:31 留言:0更新日期:2022-11-03 10:56
本公开涉及一种语音验证装置的安全性测试方法及装置,该语音验证装置用于通过语音对已注册人员的身份进行验证,所述方法包括:获取包括目标人员的多个第一语音信息的语音样本集,将对抗音频信息分别与多个第一语音信息融合,将得到的多个融合语音信息分别输入语音验证装置中,得到目标人员的第一语音特征,再根据所述目标人员的第一语音特征,以及语音验证装置中存储的已注册人员的第二语音特征,对对抗音频信息进行优化,能够利用该优化后的对抗音频信息,对语音验证装置的安全性可靠性进行有效检测,提醒用户注意语音验证装置的使用风险,并且还有利于语音验证装置的开发者对语音验证装置进行完善。音验证装置进行完善。音验证装置进行完善。

【技术实现步骤摘要】
语音验证装置的安全性测试方法及装置


[0001]本公开涉及信息处理
,尤其涉及一种语音验证装置的安全性测试方法及装置。

技术介绍

[0002]语音验证是一种比较可靠的身份验证技术,该技术可提取输入语音中的语音特征,与注册预存的语音特征进行相似度计算,如果相似度大于预设的阈值,从而判断身份一致;否则就是身份不一致。语音验证技术在设备权限控制、金融活动和刑侦取证等领域有着广泛的应用。与人脸,指纹验证相比,语音验证技术具有方便无接触,成本低和伪造难的优点。随着应用了语音验证技术的语音验证装置,越来越多地部署在人们的日常生活中,关于语音验证装置的安全性研究,就越来越受到关注和重视,有着很高的现实意义和应用价值。

技术实现思路

[0003]有鉴于此,本公开提出了一种语音验证装置的安全性测试方法及装置。
[0004]根据本公开的一方面,提供了一种语音验证装置的安全性测试方法,所述方法包括:获取语音样本集,所述语音样本集中包括目标人员的多个第一语音信息;将对抗音频信息分别与所述多个第一语音信息融合,得到多个融合语音信息;将所述多个融合语音信息分别输入所述语音验证装置中,得到所述目标人员的第一语音特征;根据所述目标人员的第一语音特征,以及所述语音验证装置中存储的已注册人员的第二语音特征,对所述对抗音频信息进行优化,得到优化后的对抗音频信息,所述优化后的对抗音频信息用于对所述语音验证装置进行安全性测试,其中,所述语音验证装置用于通过语音对已注册人员的身份进行验证。
[0005]在一种可能的实现方式中,所述方法还包括:控制音频播放设备播放所述优化后的对抗音频信息;获取所述语音验证装置针对验证语音信息的验证结果,所述验证语音信息包括所述优化后的对抗音频信息,以及在所述音频播放设备播放优化后的对抗音频信息期间,由所述目标人员发出的真实验证语音;根据所述验证结果,确定所述语音验证装置的安全性测试结果。
[0006]在一种可能的实现方式中,根据所述目标人员的第一语音特征,以及所述语音验证装置中存储的已注册人员的第二语音特征,对所述对抗音频信息进行优化,得到优化后的对抗音频信息,包括:基于第一损失函数,对所述对抗音频信息进行优化,得到第一状态的对抗音频信息;基于所述第一损失函数和第二损失函数,对所述第一状态的对抗音频信息进行优化,得到优化后的抗音频信息;其中,所述第一损失函数用于指示所述第一语音特征与所述第二语音特征的识别误差,所述第二损失函数用于指示所述对抗音频信息对语音识别内容的影响。
[0007]在一种可能的实现方式中,将对抗音频信息分别与所述多个第一语音信息融合,得到多个融合语音信息,包括:根据所述多个第一语音信息的时长,对所述对抗音频信息进
行预处理,得到与各个第一语音信息时长对应的第一音频信息;对第一语音信息及相应的第一音频信息分别进行变换,得到第二语音信息及相应的第二音频信息;其中,所述变换处理包括房间冲击响应;将所述第二语音信息及所述相应的第二音频信息融合,得到所述融合语音信息。
[0008]在一种可能的实现方式中,在所述目标人员为未注册人员的情况下,所述优化后的对抗音频信息用于:使得所述语音验证装置输出的验证结果为验证成功;在所述目标人员为已注册人员的情况下,所述优化后的对抗音频信息用于:使得所述语音验证装置输出的验证结果为验证失败。
[0009]在一种可能的实现方式中,所述语音验证装置包括语音识别模块、说话人验证模块、重放检测模块;其中,所述语音识别模块用于识别验证语音信息的内容信息,所述说话人验证模块用于识别验证语音信息特征是否属于已注册人员的语音信息特征,所述重放检测模块用于检测验证语音信息是否为经过录音后再次播放的语音信息。
[0010]根据本公开的另一方面,提供了一种语音验证装置的安全性测试装置,所述装置包括:语音样本集获取模块,用于获取语音样本集,所述语音样本集中包括目标人员的多个第一语音信息;融合模块,用于将对抗音频信息分别与所述多个第一语音信息融合,得到多个融合语音信息;特征获取模块,用于将所述多个融合语音信息分别输入所述语音验证装置中,得到所述目标人员的第一语音特征;优化模块,用于根据所述目标人员的第一语音特征,以及所述语音验证装置中存储的已注册人员的第二语音特征,对所述对抗音频信息进行优化,得到优化后的对抗音频信息,所述优化后的对抗音频信息用于对所述语音验证装置进行安全性测试,其中,所述语音验证装置用于通过语音对已注册人员的身份进行验证。
[0011]在一种可能的实现方式中,所述装置还包括:音频播放模块,用于控制音频播放设备播放所述优化后的对抗音频信息;验证结果获取模块,用于获取所述语音验证装置针对验证语音信息的验证结果,所述验证语音信息包括所述优化后的对抗音频信息,以及在所述音频播放设备播放优化后的对抗音频信息期间,由所述目标人员发出的真实验证语音;安全性测试结果确定模块,用于根据所述验证结果,确定所述语音验证装置的安全性测试结果。
[0012]在一种可能的实现方式中,所述特征获取模块用于:基于第一损失函数,对所述对抗音频信息进行优化,得到第一状态的对抗音频信息;基于所述第一损失函数和第二损失函数,对所述第一状态的对抗音频信息进行优化,得到优化后的抗音频信息;其中,所述第一损失函数用于指示所述第一语音特征与所述第二语音特征的识别误差,所述第二损失函数用于指示所述对抗音频信息对语音识别内容的影响。
[0013]在一种可能的实现方式中,所述融合模块用于:根据所述多个第一语音信息的时长,对所述对抗音频信息进行预处理,得到与各个第一语音信息时长对应的第一音频信息;对第一语音信息及相应的第一音频信息分别进行变换,得到第二语音信息及相应的第二音频信息;其中,所述变换处理包括房间冲击响应;将所述第二语音信息及所述相应的第二音频信息融合,得到所述融合语音信息。
[0014]在一种可能的实现方式中,在所述目标人员为未注册人员的情况下,所述优化后的对抗音频信息用于:使得所述语音验证装置输出的验证结果为验证成功;在所述目标人员为已注册人员的情况下,所述优化后的对抗音频信息用于:使得所述语音验证装置输出
的验证结果为验证失败。
[0015]根据本公开的另一方面,提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为调用所述存储器存储的指令,以执行上述的方法。
[0016]根据本公开的另一方面,提供了一种非易失性计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。
[0017]在本公开实施例中,可将对抗音频信息和第一语音信息的融合语音信息输入语音验证装置,得到目标人员的第一语音特征,并根据目标人员的第一语音特征和已注册人员的第二语音特征,对对抗音频信息进行优化,得到优化后的对抗音频信息,能够通过该优化后的对抗音频信息,对语音验证装置的安全性可靠性进行有效检测,提醒用户注意语音验证装置的使用风险,有利于语音验证装置的开发者对语音验证装置进行完本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音验证装置的安全性测试方法,其特征在于,所述方法包括:获取语音样本集,所述语音样本集中包括目标人员的多个第一语音信息;将对抗音频信息分别与所述多个第一语音信息融合,得到多个融合语音信息;将所述多个融合语音信息分别输入所述语音验证装置中,得到所述目标人员的第一语音特征;根据所述目标人员的第一语音特征,以及所述语音验证装置中存储的已注册人员的第二语音特征,对所述对抗音频信息进行优化,得到优化后的对抗音频信息,所述优化后的对抗音频信息用于对所述语音验证装置进行安全性测试,其中,所述语音验证装置用于通过语音对已注册人员的身份进行验证。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:控制音频播放设备播放所述优化后的对抗音频信息;获取所述语音验证装置针对验证语音信息的验证结果,所述验证语音信息包括所述优化后的对抗音频信息,以及在所述音频播放设备播放优化后的对抗音频信息期间,由所述目标人员发出的真实验证语音;根据所述验证结果,确定所述语音验证装置的安全性测试结果。3.根据权利要求1所述的方法,其特征在于,根据所述目标人员的第一语音特征,以及所述语音验证装置中存储的已注册人员的第二语音特征,对所述对抗音频信息进行优化,得到优化后的对抗音频信息,包括:基于第一损失函数,对所述对抗音频信息进行优化,得到第一状态的对抗音频信息;基于所述第一损失函数和第二损失函数,对所述第一状态的对抗音频信息进行优化,得到优化后的抗音频信息;其中,所述第一损失函数用于指示所述第一语音特征与所述第二语音特征的识别误差,所述第二损失函数用于指示所述对抗音频信息对语音识别内容的影响。4.根据权利要求1所述的方法,其特征在于,将对抗音频信息分别与所述多个第一语音信息融合,得到多个融合语音信息,包括:根据所述多个第一语音信息的时长,对所述对抗音频信息进行预处理,得到与各个第一语音信息时长对应的第一音频信息;对第一语音信息及相应的第一音频信息分别进行变换,得到第二语音信息及相应的第二音频信息;其中,所述变换处理包括房间冲击响应;将所述第二语音信息及所述相应的第二音频信息融合,得到所述融合语音信息。5.根据权利要求2所述的方法,其特征在于,在所述目标人员为未注册人员...

【专利技术属性】
技术研发人员:胡晓林张巍译李建民
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1