扬声器回放的检测制造技术

技术编号:24598672 阅读:51 留言:0更新日期:2020-06-21 04:02
一种确定声音是否由扬声器生成的方法,包括接收代表所述声音的至少一部分的音频信号。所述音频信号被分离在不同的频带中。比较不同的频带的信号内容。基于所述比较,标识信号内容中指示使用扬声器的基于频率的变化。

Speaker playback detection

【技术实现步骤摘要】
【国外来华专利技术】扬声器回放的检测
本文所描述的实施方案涉及用于检测何时信号通过扬声器播放的方法和设备。
技术介绍
语音生物测定系统越来越广泛地被使用。在这样的系统中,用户通过在注册阶段期间提供他们的话语的样本来训练系统。在后续的使用中,系统能够在已注册用户和未登记的说话人之间进行辨别。语音生物测定系统原则上可以用于控制对各种服务和系统的访问权。恶意方试图击败语音生物测定系统的一种方式是获取已注册用户的话语的录音,且回放该录音以试图冒充已注册用户以及获得对旨在限于已注册用户的服务的访问权。这称为重放攻击或欺骗攻击。
技术实现思路
根据本专利技术的一个方面,提供了一种确定声音是否由扬声器生成的方法,该方法包括:接收代表所述声音的至少一部分的音频信号;将所述音频信号分离在不同的频带中;比较不同的频带的信号内容;以及基于所述比较,标识信号内容中指示使用扬声器的基于频率的变化。根据本专利技术的一个方面,提供了一种确定声音是否由扬声器生成的方法,该方法包括:接收代表所述声音的音频信号;试图在所接收的音频信号中检测由作为扬声器的特性的非线性所产生的特征;以及如果检测到所述特征,则确定所述声音是由扬声器生成的。根据本专利技术的另一方面,提供了一种用于确定声音是否由扬声器生成的系统,该系统被配置用于根据所述方法中的任一方法进行操作。根据本专利技术的另一方面,提供了一种包括这种系统的设备。所述设备可以包括移动电话、音频播放器、视频播放器、移动计算平台、游戏设备、遥控器设备、玩具、机器或家庭自动化控制器或家用电器。根据本专利技术的另一方面,提供了一种计算机程序产品,包括计算机可读有形介质,以及用于执行根据第一方面的方法的指令。根据本专利技术的另一方面,提供了一种非暂时性计算机可读存储介质,在所述非暂时性计算机可读存储介质上存储有计算机可执行指令,当由处理器电路系统执行所述计算机可执行指令时,所述计算机可执行指令使所述处理器电路系统执行根据第一方面的方法。附图说明为了更好地理解本专利技术且示出可以如何实施本专利技术,现在将参考附图,在附图中:图1例示了一个智能电话;图2是例示智能电话的形式的示意图;图3例示了正在执行重放攻击的一种情形;图4例示了扬声器的特性;图5是例示分析音频信号的方法的流程图;图6是例示分析系统的框图;图7更详细地例示了图6的系统的一部分;以及图8例示了图6的系统的一个实施方案。具体实施方式下面的描述阐述了根据本公开内容的示例实施方案。对于本领域普通技术人员而言,其他示例实施方案和实施方式将是显而易见的。此外,本领域普通技术人员将认识到,可以代替下面所讨论的实施方案或与下面讨论的实施方案相结合地应用多种等同技术,且所有这样的等同物应被认为是本公开内容所涵盖的。本文所描述的方法可以在各种各样的设备和系统(例如,移动电话、音频播放器、视频播放器、移动计算平台、游戏设备、遥控器设备、玩具、机器或家庭自动化控制器或家用电器)中实施。然而,为了易于解释一个实施方案,将描述一个例示性实施例,其中实施方式发生在智能电话中。图1例示了一个智能电话10,该智能电话10具有用于检测周边声音的麦克风12。在正常使用中,麦克风当然用于检测将智能电话10握持在他们的脸部附近的用户的话语。图2是例示智能电话10的形式的示意图。具体地,图2示出了智能电话10的多个互连部件。应理解,智能电话10实际上将包含许多其他部件,但是以下描述对于理解本专利技术是足够的。因此,图2示出了上面所提及的麦克风12。在某些实施方案中,智能电话10设置有多个麦克风12、12a、12b等。图2还示出了存储器14,该存储器14实际上可以被设置为单个部件或多个部件。存储器14被设置用于存储数据和程序指令。图2还示出了处理器16,该处理器16实际上也可以被设置为单个部件或多个部件。例如,处理器16的一个部件可以是智能电话10的应用处理器。图2还示出了收发器18,该收发器18被设置用于允许智能电话10与外部网络通信。例如,收发器18可以包括用于经由WiFi局域网或经由蜂窝网络建立互联网连接的电路系统。图2还示出了音频处理电路系统20,用于根据需要对由麦克风12所检测到的音频信号执行操作。例如,音频处理电路系统20可以对音频信号进行滤波,或可执行其他信号处理操作。在此实施方案中,智能电话10设置有语音生物测定功能且设置有控制功能。因此,智能电话10能够响应于来自已注册用户的口语命令来执行多种功能。生物测定功能能够在来自已注册用户的口语命令和由一个不同的人说出的相同命令之间进行区分。因此,本专利技术的某些实施方案涉及操作智能电话或具有某种语音可操作性的另一便携式电子设备,例如平板计算机或膝上型计算机、游戏控制台、家庭控制系统、家庭娱乐系统、车载娱乐系统、家用电器等,其中在旨在执行口语命令的设备中执行语音生物测定功能。某些其他实施方案涉及在智能电话或其他设备上执行语音生物测定功能的系统,如果语音生物测定功能能够确认说话人是已注册用户,则智能电话或其他设备将命令发送至一个分立的设备。在一些实施方案中,虽然在智能电话10或靠近用户定位的其他设备上执行语音生物测定功能,但是使用收发器18将口语命令传输至远程话语识别系统,该远程话语识别系统确定口语命令的含义。例如,话语识别系统可以位于云计算环境中的一个或多个远程服务器上。然后,基于口语命令的含义的信号被返回至智能电话10或其他本地设备。图3示出了正在执行重放攻击的情形的一个实施例。因此,在图3中,智能电话10设置有语音生物测定功能。在此实施例中,智能电话10至少暂时地拥有一个攻击者,该攻击者具有另一智能电话30。智能电话30已经被用来记录智能电话10的已注册用户的语音。使智能电话30靠近智能电话10的麦克风入口12,且回放已注册用户的语音的录音。如果语音生物测定系统不能够检测它所检测到的已注册用户的语音是录音,则攻击者将获得对旨在仅由已注册用户可访问的一个或多个服务的访问权。已知的是,由于尺寸约束,智能电话(诸如,智能电话30)通常设置有具有相对低质量的扬声器。因此,通过这种扬声器所回放的已注册用户的语音的录音不会与该用户的语音完美匹配,且这一事实可被用来标识重放攻击。例如,扬声器可以具有某些频率相关的特性,且如果可以在由语音生物测定系统所接收的话语信号中检测到这些频率相关的特性,则可以认为该话语信号由重放攻击产生。尽管图3例示了所公开的分析音频信号的方法的一种可能用途,但是该方法更普遍地适用于期望确定所检测到的声音是否通过扬声器播放的任何系统。在此实施例中,该方法利用典型的扬声器具有取决于频率的非线性这一事实。这与例如麦克风相反,麦克风具有基本上独立于频率的非线性。图4例示了典型的扬声器的非线性特性。具体地,图4示出了总谐波失真(THD)随着频率的变化。在低于扬声本文档来自技高网...

【技术保护点】
1.一种确定声音是否由扬声器生成的方法,该方法包括:/n接收代表所述声音的至少一部分的音频信号;/n将所述音频信号分离在不同的频带中;/n比较不同的频带的信号内容;以及/n基于所述比较,标识信号内容中指示使用扬声器的基于频率的变化。/n

【技术特征摘要】
【国外来华专利技术】20180201 GB 1801659.2;20171114 US 62/585,6601.一种确定声音是否由扬声器生成的方法,该方法包括:
接收代表所述声音的至少一部分的音频信号;
将所述音频信号分离在不同的频带中;
比较不同的频带的信号内容;以及
基于所述比较,标识信号内容中指示使用扬声器的基于频率的变化。


2.根据权利要求1所述的方法,其中比较不同的频带的信号内容的步骤包括:
对不同的频带的信号内容执行统计分析以生成统计度量,以及比较针对不同的频带的统计度量。


3.根据权利要求1或2所述的方法,还包括:
如果标识了信号内容中指示使用扬声器的变化,则生成扬声器指示输出信号。


4.根据权利要求1、2或3所述的方法,包括试图通过以下步骤在所接收的音频信号中检测由非线性所产生的特征,该非线性在第一音频频率处比在第二音频频率处更大:
将所接收的音频信号分离为第一音频频率分量和第二音频频率分量;以及
分析所述第一音频频率分量和所述第二音频频率分量。


5.根据权利要求4所述的方法,包括:
分析所述第一音频频率分量和所述第二音频频率分量,以获得相应的度量;以及
比较所述度量,以标识由非线性所产生的特征,该非线性在第一音频频率处比在第二音频频率处更大。


6.根据权利要求4或5所述的方法,其中分析所述第一音频频率分量和所述第二音频频率分量中的至少一个包括获得与相应的分量的样本值有关的统计度量。


7.根据权利要求6所述的方法,其中所述统计度量是所述声音的波形的不对称性的测量。


8.根据权利要求6所述的方法,其中所述统计度量是所述样本值的偏度的测量。


9.根据权利要求8所述的方法,其中所述偏度的测量是皮尔森偏度系数、非参数偏度或四分位偏度系数。


10.根据权利要求8或9在从属于权利要求5时所述的方法,包括:
获得所述第一音频频率分量的样本值的偏度的测量;
获得所述第二音频频率分量的样本值的偏度的测量;
如果所述第一音频频率分量的样本值的偏度的测量与所述第二音频频率分量的样本值的偏度的测量的比率超过了一个阈值,则确定所接收的音频信号具有由非线性所产生的特征,该非线性在第一音频频率处比在第二音频频率处更大。


11.根据权利要求10所述的方法,包括设置所述阈值。


12.根据权利要求10所述的方法,其中所接收的音频信号代表话语,所述方法包括基于说话人的假定身份来设置所述阈值。


13.根据权利要求10所述的方法,包括基于所接收的信号的水平来设置所述阈值。


14.根据权利要求8或9在从属于权利要求5时所述的方法,包括:
获得所述第一音频频率分量的样本值的偏度的测量;
获得所述第二音频频率分量的样本值的偏度的测量;
如果所述第一音频频率分量的样本值的偏度的测量与所述第二音频频率分量的样本值的偏度的测量之间的差异超过了一个阈值,则确定所接收的音频信号具有由非线性所产生的特征,该非线性在第一音频频率处比在第二音频频率处更大。


15.根据权利要求6至14中的一项所述的方法,包括在获得所述统计度量之前,去除具有小样本值的样本。


16.根据权利要求15所述的方法,包括使用非线性量化器来去除具有小样本值的样本。


17.根据权利要求6至14中的一项所述的方法,包括在获得所述统计度量之前,将非线性增益施加至所述样本值。


18.根据权利要求17所述的方法,其中所述非线性增益是压缩。


19.根据权利要求6所述的方法,其中获得与所述相应的分量的样本值有关的统计度量包括与所述相应的分量的样本值有关...

【专利技术属性】
技术研发人员:J·P·莱索
申请(专利权)人:思睿逻辑国际半导体有限公司
类型:发明
国别省市:英国;GB

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1