【技术实现步骤摘要】
【国外来华专利技术】现场性的检测
本文所描述的实施方案涉及用于检测说话人的现场性(liveness)的方法和设备。作为一个实施例,现场性检测可以用于检测对语音生物测定系统(voicebiometricssystem)的重放攻击。另外,本文所描述的实施方案涉及用于提高话语(speech)处理系统的鲁棒性的方法和设备。
技术介绍
生物测定系统越来越广泛地被使用。在语音生物测定系统中,用户通过在注册阶段期间提供他们的话语的样本来训练系统。在随后的使用中,系统能够在已注册用户和未登记的说话人进行辨别。语音生物测定系统原则上可以用于控制对各种服务和系统的访问权。恶意方试图击败语音生物测定系统的一种方式是获得已注册用户的话语的录音,且回放该录音以试图冒充已注册用户以及获得对旨在限于已注册用户的服务的访问权。这被称为重放攻击或欺骗攻击。在面部识别或其他类型的生物测定系统中,该系统识别用户的特性。再次,恶意方试图击败这样的生物测定系统的一种方式是向系统呈现已注册用户的照片或视频录音。另外,许多设备包括麦克风,所述麦克风可 ...
【技术保护点】
1.一种检测现场性的方法,该方法包括:/n接收话语信号;/n生成超声信号;/n检测所生成的超声信号的反射;/n检测所生成的超声信号的反射中的多普勒频移;以及/n基于所检测到的多普勒频移来对所接收的话语信号是否指示说话人的现场性进行标识,/n其中基于所检测到的多普勒频移来对所接收的话语信号是否指示现场性进行标识包括:/n确定所检测到的多普勒频移是否对应于话语发音速率。/n
【技术特征摘要】
【国外来华专利技术】20180201 GB 1801661.8;20180201 GB 1801664.2;2018021.一种检测现场性的方法,该方法包括:
接收话语信号;
生成超声信号;
检测所生成的超声信号的反射;
检测所生成的超声信号的反射中的多普勒频移;以及
基于所检测到的多普勒频移来对所接收的话语信号是否指示说话人的现场性进行标识,
其中基于所检测到的多普勒频移来对所接收的话语信号是否指示现场性进行标识包括:
确定所检测到的多普勒频移是否对应于话语发音速率。
2.根据权利要求1所述的方法,其中确定所检测到的多普勒频移是否对应于话语发音速率包括:
确定所检测到的多普勒频移是否对应于4Hz-10Hz的范围内的频率的面部移动。
3.根据权利要求1或2所述的方法,其中确定所检测到的多普勒频移是否对应于话语发音速率包括:
确定与所述话语信号相关联的发音速率;以及
确定所检测到的多普勒频移是否对应于与所述话语信号相关联的发音速率的面部移动。
4.根据权利要求2所述的方法,还包括:
如果确定所检测到的多普勒频移对应于4Hz-10Hz的范围内的频率的面部移动,则:
确定与所述话语信号相关联的发音速率;
确定所检测到的多普勒频移是否对应于与所述话语信号相关联的发音速率的唇部移动;以及
如果所检测到的多普勒频移对应于与所述话语信号相关联的发音速率的唇部移动,则确定所接收的话语信号指示现场性。
5.根据权利要求1至4中的任一项所述的方法,该方法在语音生物测定系统中使用,其中对所接收的话语信号是否指示现场性进行标识包括确定所接收的话语信号是否可能是重放攻击的产物。
6.一种用于现场性检测的系统,该系统包括:
至少一个麦克风输入,用于接收来自麦克风的音频信号;以及
至少一个换能器输出,用于将信号传输至超声换能器,且该系统被配置用于:
接收所述至少一个麦克风输入处的话语信号;
通过在所述至少一个换能器输出处传输信号来生成超声信号;
检测所生成的超声信号的反射;
检测所生成的超声信号的反射中的多普勒频移;以及
基于所检测到的多普勒频移来对所接收的话语信号是否指示说话人的现场性进行标识,
其中基于所检测到的多普勒频移来对所接收的话语信号是否指示现场性进行标识包括:
确定所检测到的多普勒频移是否对应于话语发音速率。
7.一种包括根据权利要求6所述的系统的设备。
8.根据权利要求7所述的设备,其中所述设备包括移动电话、音频播放器、视频播放器、移动计算平台、游戏设备、遥控器设备、玩具、机器或家庭自动化控制器或家用电器。
9.一种计算机程序产品,包括计算机可读有形介质,以及用于执行根据权利要求1至5中的任一项所述的方法的指令。
10.一种非暂时性计算机可读存储介质,在所述非暂时性计算机可读存储介质上存储有计算机可执行指令,当由处理器电路系统执行所述计算机可执行指令时,所述计算机可执行指令使所述处理器电路系统执行根据权利要求1至5中的任一项所述的方法。
11.一种包括根据权利要求10所述的非暂时性计算机可读存储介质的设备。
12.根据权利要求11所述的设备,其中所述设备包括移动电话、音频播放器、视频播放器、移动计算平台、游戏设备、遥控器设备、玩具、机器或家庭自动化控制器或家用电器。
13.一种现场性检测的方法,该方法包括:
生成超声信号;
接收包括所述超声信号的反射的音频信号;
使用所接收的包括所述超声信号的反射的音频信号来检测说话人的现场性;
监测周边超声噪声;以及
基于经反射的超声的水平和所监测到的周边超声噪声来调整接收所述音频信号的系统的操作。
14.根据权利要求13所述的方法,该方法在语音生物测定系统中使用,其中检测说话人的现场性包括确定所接收的话语信号是否可能是重放攻击的产物,且包括:
基于经反射的超声的水平和所监测到的周边超声噪声来调整所述语音生物测定系统的操作。
15.根据权利要求14所述的方法,包括:
检测所生成的超声信号的反射中的多普勒频移;以及
基于所检测到的多普勒频移来对所接收的话语信号是否可能是对所述语音生物测定系统的重放攻击的结果进行标识,
该方法还包括:
基于所监测到的周边超声噪声的水平来确定对所接收的话语信号是否可能是重放攻击的结果的标识的依赖。
16.根据权利要求15所述的方法,其中确定对所述标识的依赖包括:如果所监测到的周边超声噪声的水平超过了第一阈值水平,则不执行所述标识。
17.根据权利要求14所述的方法,包括:
检测所生成的超声信号的反射中的多普勒频移;以及
基于所检测到的多普勒频移来对所接收的话语信号是否可能是对语音生物测定系统的重放攻击的结果进行标识,
其中基于所检测到的多普勒频移来对所接收的话语信号是否可能是重放攻击的结果进行标识包括:
确定所检测到的多普勒频移与所接收的话语信号之间的相关性;以及
基于所监测到的周边超声噪声的水平来适配一个相关阈值,该相关阈值在对所接收的话语信号是否可能是重放攻击的结果进行标识中使用。
18.一种用于现场性检测的系统,该系统包括:
至少一个麦克风输入,用于接收来自麦克风的音频信号;以及
至少一个换能器输出,用于将信号传输至超声换能器,且该系统被配置用于:
生成超声信号;
接收包括所述超声信号的反射的音频信号;
使用所接收的包括所述超声信号的反射的音频信号来检测说话人的现场性;
监测周边超声噪声;以及
基于经反射的超声的水平和所监测到的周边超声噪声来调整接收所述音频信号的系统的操作。
19.一种包括根据权利要求18所述的系统的设备。
20.根据权利要求19所述的设备,其中所述设备包括移动电话、音频播放器、视频播放器、移动计算平台、游戏设备、遥控器设备、玩具、机器或家庭自动化控制器或家用电器。
21.一种计算机程序产品,包括计算机可读有形介质,以及用于执行根据权利要求13至17中的任一项所述的方法的指令。
22.一种非暂时性计算机可读存储介质,在所述非暂时性计算机可读存储介质上存储有计算机可执行指令,当由处理器电路系统执行所述计算机可执行指令时,所述计算机可执行指令使所述处理器电路系统执行根据权利要求13至17中的任一项所述的方法。
23.一种包括根据权利要求22所述的非暂时性计算机可读存储介质的设备。
24.根据权利要求23所述的设备,其中所述设备包括移动电话、音频播放器、视频播放器、移动计算平台、游戏设备、遥控器设备、玩具、机器或家庭自动化控制器或家用电器。
25.一种在设备中进行现场性检测的方法,该方法包括:
接收来自语音源的话语信号;
通过所述设备的换能器生成且传输超声信号;
检测所传输的超声信号的反射;
检测所生成的超声信号的反射中的多普勒频移;以及
基于所检测到的多普勒频移来对所接收的话语信号是否指示说话人的现场性进行标识,
且该方法还包括:
获得关于所述设备的位置的信息;以及
基于关于所述设备的位置的信息来调整所述超声信号的生成和传输。
26.根据权利要求25所述的方法,其中适配所述超声信号的生成和传输包括:
调整所述超声信号的传输功率。
27.根据权利要求25或26所述的方法,其中所述设备具有多个换能器,且其中适配所述超声信号的生成和传输包括:
选择生成所述超声信号的换能器。
28.根据权利要求25、26或27所述的方法,其中获得关于所述设备的位置的信息包括获得关于所述设备的取向的信息。
29.根据权利要求25、26、27或28所述的方法,其中获得关于所述设备的位置的信息包括获得关于所述设备与所述语音源的距离的信息。
30.根据权利要求25所述的方法,其中所述设备是一个移动电话,所述移动电话包括位于所述设备的下端处的至少第一换能器以及位于所述设备的上端处的第二换能器,且其中基于关于所述设备的位置的信息来适配所述超声信号的生成和传输包括:
如果关于所述设备的位置的信息指示正在以靠近通话模式使用所述设备,则在1cm处以70-90dBSPL的范围内的强度传输来自所述第一换能器的超声信号。
31.根据权利要求25所述的方法,其中所述设备是一个移动电话,所述移动电话包括位于所述设备的下端处的至少第一换能器以及位于所述设备的上端处的第二换能器,且其中基于关于所述设备的位置的信息来适配所述超声信号的生成和传输包括:
如果关于所述设备的位置的信息指示正在以附近通话模式使用所述设备,则在1cm处以90-110dBSPL的范围内的强度传输所述超声信号。
32.根据权利要求27所述的方法,其中基于关于所述设备的位置的信息来适配所述超声信号的生成和传输包括:
如果关于所述设备的位置的信息指示正在以总体水平取向使用所述设备,则传输来自所述第一换能器的超声信号。
33.根据权利要求27或32所述的方法,其中基于关于所述设备的位置的信息来适配所述超声信号的生成和传输包括:
如果关于所述设备的位置的信息指示正在以总体竖直取向使用所述设备,则传输来自所述第二换能器的超声信号。
34.根据权利要求25至33中的任一项所述的方法,其中基于关于所述设备的位置的信息来适配所述超声信号的生成和传输包括:
如果关于所述设备的位置的信息指示正在以远端通话模式使用所述设备,则阻止所述超声信号的传输。
35.根据权利要求29所述的方法,其中适配所述超声信号的生成和传输包括对于低于预定最大距离的距离,调整所述超声信号的传输功率,其中当所述设备距所述语音源较远时使用较高的功率。
36.根据权利要求25至35中的任一项所述的方法,其中获得关于所述设备的位置的信息包括获得关于多个扬声器换能器中的哪一个扬声器换能器最靠近所述语音源的信息,且适配所述超声信号的生成和传输包括主要地或完全地传输来自那个扬声器的超声信号。
37.根据权利要求25至36中的任一项所述的方法,包括从以下中的一个或多个获得关于所述设备的位置的信息:
陀螺仪、加速度计、接近传感器、光水平传感器、触摸传感器、声音水平传感器和摄像机。
38.根据权利要求25至37中的任一项所述的方法,该方法在语音生物测定系统中使用,...
【专利技术属性】
技术研发人员:J·P·莱索,
申请(专利权)人:思睿逻辑国际半导体有限公司,
类型:发明
国别省市:英国;GB
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。