重放攻击的检测制造技术

技术编号:27483857 阅读:22 留言:0更新日期:2021-03-02 17:57
一种检测重放攻击的方法包括:接收表示言语的音频信号;识别存在于所述音频信号的至少一部分中的言语内容;获得关于所述音频信号中识别了言语内容的每个部分的频谱的信息;以及对于所述音频信号中识别了言语内容的每个部分:检索关于所述音频信号的预期频谱的信息;将所述音频信号中识别了言语内容的部分的频谱与相应的预期频谱进行比较;以及如果所述音频信号中识别了言语内容的所述部分的所述频谱与所述相应的预期频谱之间的差异的度量值超出阈值水平,则确定所述音频信号可能是由重放攻击引起的。放攻击引起的。放攻击引起的。

【技术实现步骤摘要】
【国外来华专利技术】重放攻击的检测


[0001]本文所描述的实施方案涉及用于检测语音生物识别系统(voice biometrics system)上的重放攻击的方法和设备。

技术介绍

[0002]语音生物识别系统正被广泛使用。在这种系统中,用户通过在登记阶段提供其言语样本来训练系统。在后续的使用中,系统能够区分已登记用户与未注册的说话者。语音生物识别系统原则上可用来控制对大范围的服务和系统的访问。
[0003]恶意方试图打败语音生物识别系统的一种方法是获得已登记用户的言语的录音,并且回放该录音,以试图冒充已登记用户并取得对原定仅限于已登记用户的服务的访问权限。
[0004]这称为重放攻击或称为欺骗攻击。

技术实现思路

[0005]根据本专利技术的一个方面,提供了一种检测重放攻击的方法,所述方法包括:
[0006]接收表示言语的音频信号;
[0007]识别存在于音频信号的至少一部分中的言语内容;
[0008]获得关于音频信号中识别了言语内容的每个部分的频谱的信息;
[0009]对于音频信号中识别了言语内容的每个部分,检索关于音频信号的预期频谱的信息;
[0010]将音频信号中识别了言语内容的部分的频谱与相应的预期频谱进行比较;以及
[0011]如果音频信号中识别了言语内容的部分的频谱与相应的预期频谱之间的差异的度量值超出阈值水平,则确定音频信号可能是由重放攻击引起的。
[0012]所述方法还可包括:
[0013]从接收到的音频信号中移除声道和/或噪声的影响;以及
[0014]当获得关于音频信号中识别了言语内容的每个部分的频谱的信息时,在移除声道和/或噪声的影响后使用所述音频信号。
[0015]识别存在于音频信号的至少一部分中的言语内容可包括识别至少一个测试声学类别。至少一个测试声学类别可包括一个或多个特定音素。至少一个测试声学类别可包括摩擦音,尤其是齿擦音;和/或可包括爆破音。
[0016]识别至少一个测试声学类别可包括识别测试声学类别在已知言语内容中的出现位置。已知言语内容可包括密码短语。
[0017]将音频信号中识别了言语内容的部分的频谱与相应的预期频谱进行比较可包括:
[0018]将音频信号中识别了言语内容的部分的频谱与在5kHz至20kHz范围内的频带中的相应预期频谱进行比较。
[0019]将音频信号中识别了言语内容的部分的频谱与相应的预期频谱进行比较可包括:
[0020]将音频信号中识别了言语内容的部分的频谱与在20Hz至200Hz范围内的频带中的相应预期频谱进行比较。
[0021]将音频信号中识别了言语内容的部分的频谱与相应的预期频谱进行比较可包括:
[0022]将音频信号中识别了言语内容的部分的频谱与在超声波频带中的相应预期频谱进行比较。
[0023]将音频信号的所识别部分与有关对应的测试声学类别的相应所检索信息进行比较可包括:
[0024]将音频信号的所识别部分的至少一个频带中的功率水平与音频信号的预期频谱的至少一个对应频带中的功率水平进行比较。
[0025]音频信号的所识别部分与有关对应测试声学类别的相应所检索信息之间的差异的度量值可包括大于1dB的功率差异。
[0026]所述方法还可包括:
[0027]对接收到的音频信号执行说话者识别过程;以及
[0028]对于每个测试声学类别,检索关于由所述说话者识别过程识别的说话者的音频信号的预期频谱的信息。
[0029]检索关于音频信号的预期频谱的信息的步骤可包括:识别音频信号中预期将出现至少一个特定声学类别的位置;并且将音频信号中识别了言语内容的部分的频谱与相应的预期频谱进行比较的步骤可包括:将所述所识别位置处的频谱与所述所识别位置处的预期频谱进行比较。
[0030]特定声学类别可包括至少一些摩擦音。
[0031]所述方法可包括确定在预期将出现摩擦音的所述位置处的频谱是否是摩擦音的特性。
[0032]识别音频信号中预期将出现至少一个特定声学类别的位置的步骤可包括:识别预定话语中至少一个特定声学类别出现的位置。
[0033]预定话语可包括密码短语。
[0034]根据本专利技术的另一方面,提供了一种用于检测重放攻击的系统,所述系统包括:
[0035]输入,其用于接收表示言语的音频信号;以及
[0036]处理器,其中所述处理器被配置用于:
[0037]识别存在于音频信号的至少一部分中的言语内容;
[0038]获得关于音频信号中识别了言语内容的每个部分的频谱的信息;
[0039]对于音频信号中识别了言语内容的每个部分,检索关于音频信号的预期频谱的信息;
[0040]将音频信号中识别了言语内容的部分的频谱与相应的预期频谱进行比较;以及
[0041]如果音频信号中识别了言语内容的部分的频谱与相应的预期频谱之间的差异的度量值超出阈值水平,则确定音频信号可能是由重放攻击引起的。
[0042]还提供了一种包括这种系统的设备,其中所述设备包括以下中的一个:智能电话、平板计算机或膝上型计算机、游戏控制台、家庭控制系统、家庭娱乐系统、车载娱乐系统或家用电器。
[0043]根据本专利技术的另一方面,提供了一种计算机程序产品,所述计算机程序产品包括
有形的计算机可读介质,所述有形的计算机可读介质存储用于致使合适的经编程处理器执行第一方面的方法的代码。
[0044]根据第二方面,提供了一种检测重放攻击的方法,所述方法包括:
[0045]接收表示言语的音频信号;
[0046]识别音频信号中言语由摩擦音组成的至少一个部分;
[0047]获得关于在所述音频信号的所述至少一个部分期间以超声波频率存在的能量的量的信息;以及
[0048]基于关于以超声波频率存在的能量的量的所述信息而确定音频信号是否可能是由重放攻击引起的。
[0049]所述方法还可包括:
[0050]获得关于在音频信号中言语由浊音言语组成的第二部分期间以超声波频率存在的能量的量的信息;以及
[0051]基于关于以超声波频率存在的能量的量的所述信息并且基于关于在音频信号的第二部分期间以超声波频率存在的能量的量的所述信息,确定音频信号是否可能是由重放攻击引起的。
[0052]所述方法可包括:
[0053]基于在音频信号的所述至少一个部分期间以超声波频率存在的能量的量与在音频信号的第二部分期间以超声波频率存在的能量的量的比率,确定音频信号是否可能是由重放攻击引起的。
[0054]所述方法还可包括:
[0055]获得关于在所述音频信号的所述至少一个部分期间以可听频率存在的能量的量的信息;以及
[0056]基于关于在音频信号的所述至少一个部分期间以超声波频率存在的能量的量的所述信息并且基于关于在音频信号的所述至少一个部分期间以可听频率存在的能量的量的所述信息,确定音本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种检测重放攻击的方法,所述方法包括:接收表示言语的音频信号;识别存在于所述音频信号的至少一部分中的言语内容;获得关于所述音频信号中识别了言语内容的每个部分的频谱的信息;以及对于所述音频信号中识别了言语内容的每个部分:检索关于所述音频信号的预期频谱的信息;将所述音频信号中识别了言语内容的部分的所述频谱与相应的预期频谱进行比较;以及如果所述音频信号中识别了言语内容的所述部分的所述频谱与所述相应的预期频谱之间的差异的度量值超出阈值水平,则确定所述音频信号可能是由重放攻击引起的。2.根据权利要求1所述的方法,其包括:从接收到的音频信号中移除声道和/或噪声的影响;以及当获得关于所述音频信号中识别了言语内容的每个部分的所述频谱的所述信息时,在移除所述声道和/或噪声的影响后使用所述音频信号。3.根据权利要求1所述的方法,其中识别存在于所述音频信号的至少一部分中的言语内容包括识别至少一个测试声学类别。4.根据权利要求3所述的方法,其中所述至少一个测试声学类别包括一个或多个特定音素。5.根据权利要求4所述的方法,其中所述至少一个测试声学类别包括摩擦音。6.根据权利要求5所述的方法,其中所述至少一个测试声学类别包括齿擦音。7.根据权利要求4所述的方法,其中所述至少一个测试声学类别包括爆破音。8.根据权利要求3所述的方法,其中识别至少一个测试声学类别包括识别所述测试声学类别在已知言语内容中的出现位置。9.根据权利要求8所述的方法,其中所述已知言语内容包括密码短语。10.根据权利要求1所述的方法,其中将所述音频信号中识别了言语内容的部分的所述频谱与所述相应的预期频谱进行比较包括:将所述音频信号中识别了言语内容的部分的所述频谱与在5kHz至20kHz范围内的频带中的所述相应的预期频谱进行比较。11.根据权利要求1所述的方法,其中将所述音频信号中识别了言语内容的部分的所述频谱与所述相应的预期频谱进行比较包括:将所述音频信号中识别了言语内容的部分的所述频谱与在20Hz至200Hz频带中的所述相应的预期频谱进行比较。12.根据权利要求1所述的方法,其中将所述音频信号中识别了言语内容的部分的所述频谱与所述相应的预期频谱进行比较包括:将所述音频信号中识别了言语内容的部分的所述频谱与在超声波频带中的所述相应的预期频谱进行比较。13.根据权利要求1所述的方法,其中将所述音频信号的所识别部分与有关对应测试声学类别的相应所检索信息进行比较包括:将所述音频信号的所述所识别部分的至少一个频带中的功率水平与所述音频信号的
所述预期频谱的至少一个对应频带中的功率水平进行比较。14.根据权利要求13所述的方法,其中所述音频信号的所述所识别部分与有关所述对应测试声学类别的所述相应所检索信息之间的差异的度量值包括大于1dB的功率差异。15.根据权利要求1所述的方法,其还包括:对接收到的音频信号执行说话者识别过程;以及对于每个测试声学类别,检索关于由所述说话者识别过程识别的说话者的所述音频信号的预期频谱的信息。16.根据权利要求1所述的方法,其中检索关于所述音频信号的预期频谱的信息的步骤包括:识别所述音频信号中预期将出现至少一个特定声学类别的位置;并且其中将所述音频信号中识别了言语内容的部分的所述频谱与所述相应的预期频谱进行比较的步骤包括:将所述所识别位置处的频谱与所述所识别位置处的预期频谱进行比较。17.根据权利要求16所述的方法,其中所述特定声学类别包括至少一些摩擦音。18.根据权利要求16和17所述的方法,其包括确定在预期将出现摩擦音的所述位置处的所述频谱是否是摩擦音的特性。19.根据权利要求16、17或18所述的方法,其中识别所述音频信号中预期将出现至少一个特定声学类别的位置的步骤包括:识别预定话语中至少一个特定声学类别出现的位置。20.根据权利要求19所述的方法,其中所述预定话语包括密码短语。21.一种用于检测重放攻击的系统,所述系统...

【专利技术属性】
技术研发人员:J
申请(专利权)人:思睿逻辑国际半导体有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1