一种伪造语音检测方法和装置制造方法及图纸

技术编号:37547858 阅读:13 留言:0更新日期:2023-05-12 16:23
本发明专利技术涉及一种伪造语音检测方法,所述方法具体包括:提取待检测语音信号的音频特征;提取待检测语音信号的基频微扰特征和振幅微扰特征;通过卷积神经网络将音频特征转化为一维嵌入式特征;将一维嵌入式特征、基频微扰特征和振幅微扰特征拼接在一起,得到一维隐式特征;将一维隐式特征输入分类网络确定待检测语音信号是否为伪造语音信号。还涉及了装置,包括第一预处理单元、第二预处理单元、卷积神经网络单元、拼接单元和分类网络单元。本发明专利技术的方法和装置,具有较高的泛化性,能够应对实际应用场景中的多种来源的伪造语音攻击。应用场景中的多种来源的伪造语音攻击。应用场景中的多种来源的伪造语音攻击。

【技术实现步骤摘要】
一种伪造语音检测方法和装置


[0001]本专利技术涉及伪造语音检测领域,尤其是一种伪造语音检测方法和装置。

技术介绍

[0002]21世纪以来,伴随着人工智能的蓬勃发展,许多任务都选择使用基于人工智能的自动化系统代替繁琐的人工操作,以避免枯燥重复的工作。随着深度学习技术的发展,自动说话人识别技术在近几年取得较大的进展,逐步走向实际应用场景,在数据安全、认证通过等方面发挥着重要作用。然而,一些特定的攻击手段可以骗过自动说话人验证系统,达到非法获得受保护系统授权的目的。这些攻击手段统称为语音欺骗攻击,常见的语音欺骗攻击包括录音回放、语音合成和语音转换。为了应对语音欺骗攻击对于自动说话人识别系统的重大威胁,近年来针对语音欺骗攻击的鉴伪系统的发展备受关注。然而虽然许多伪造语音检测方法被提出,但现有的伪造语音检测泛化能力低,难以实际部署。

技术实现思路

[0003]有鉴于此,本专利技术的主要目的在于提供一种伪造语音检测方法和装置,具有较高的泛化性,能够应对实际应用场景中的多种来源的伪造语音攻击。
[0004]为达到上述目的,一方面,本申请提供了一种伪造语音检测方法,包括:
[0005]提取待检测语音信号的音频特征;提取待检测语音信号的基频微扰特征和振幅微扰特征;
[0006]通过卷积神经网络将音频特征转化为一维嵌入式特征;
[0007]将一维嵌入式特征、基频微扰特征和振幅微扰特征拼接在一起,得到一维隐式特征;
[0008]将一维隐式特征输入分类网络确定待检测语音信号是否为伪造语音信号。
[0009]在一个可能的实现中,所述提取待检测语音信号的音频特征包括:
[0010]对该语音信号进行预加重、分帧及加窗处理;对处理得到的各帧信号分别进行快速傅里叶变换,得到各帧信号的频域特征;
[0011]将各帧信号的频域特征沿着频率轴拼接在一起,得到该语音信号的音频特征。
[0012]在另一个可能的实现中,所述提取待检测语音信号的基频微扰特征和振幅微扰特征包括:
[0013]对该语音信号进行预加重、分帧及加窗处理;
[0014]分别计算处理得到的各帧信号的基音周期;
[0015]取得到的基音周期的部分相邻的基音周期或全部;
[0016]采用以下基频微扰特征的计算公式中的部分或全部,分别算得基频微扰特征:
[0017][0018][0019][0020][0021]其中,J为所取的基音周期的数量,T(j)为所取的第j个基音周期的长度;
[0022]采用以下振幅微扰特征的计算公式中的部分或全部,算得振幅微扰特征:
[0023][0024][0025][0026][0027][0028]其中,A(j)为所取的第j个基音周期的峰间振幅。
[0029]在另一个可能的实现中,所述将一维隐式特征输入分类网络前还包括:采用注意
力机制将所述一维隐式特征转换为注意力值;
[0030]所述将一维隐式特征输入分类网络为:将所述注意力值输入分类网络。
[0031]在另一个可能的实现中,还包括:采用主动学习算法对所述卷积神经网络和分类网络进行训练。
[0032]另一方面,本申请提供了一种伪造语音检测装置,包括:第一预处理单元、第二预处理单元、卷积神经网络单元、拼接单元和分类网络单元;其中,
[0033]第一预处理单元,用于提取待检测语音信号的音频特征;
[0034]第二预处理单元,用于提取待检测语音信号的基频微扰特征和振幅微扰特征;
[0035]卷积神经网络单元,用于将音频特征转化为一维嵌入式特征;
[0036]拼接单元,用于将一维嵌入式特征、基频微扰特征和振幅微扰特征拼接在一起,得到一维隐式特征;
[0037]分类网络单元,用于依据一维隐式特征确定待检测语音信号是否为伪造语音信号。
[0038]在另一个可能的实现中,所述第一预处理单元,具体用于对待检测语音信号进行预加重、分帧及加窗处理;对处理得到的各帧信号分别进行快速傅里叶变换,得到各帧信号的频域特征;并用于将各帧信号的频域特征沿着频率轴拼接在一起,得到该语音信号的音频特征。
[0039]在另一个可能的实现中,所述第二预处理单元,具体用于对待检测语音信号进行预加重、分帧及加窗处理;分别计算处理得到的各帧信号的基音周期;取得到的基音周期的部分相邻的基音周期或全部;并用于采用以下基频微扰特征的计算公式中的部分或全部,分别算得基频微扰特征:
[0040][0041][0042][0043][0044]其中,J为所取的基音周期的数量,T(j)为所取的第j个基音周期的长度;
[0045]以及用于采用以下振幅微扰特征的计算公式中的部分或全部,算得振幅微扰特征:
[0046][0047][0048][0049][0050][0051]其中,A(j)为所取的第j个基音周期的峰间振幅。
[0052]在另一个可能的实现中,还包括注意力机制,用于将所述一维隐式特征转换为注意力值;
[0053]所述分类网络单元,用于依据注意力值确定待检测语音信号是否为伪造语音信号。
[0054]在另一个可能的实现中,还包括训练单元,用于采用主动学习算法对所述卷积神经网络和分类网络进行训练。
[0055]基于上述,本专利技术提供的一种伪造语音检测方法和装置,具有以下优点和特点:
[0056]1、同时利用人工设计特征音频特征和伪造语音的基频痕迹微扰特征,使得数据信息涵盖语音的基本信息和伪造语音的特异信息,对信息的利用更充分,提高了泛化性,同时没有引入过多的数据预处理步骤。
[0057]2、对所使用的音频特征和微扰特征进行动态加权,使得模型所使用的信息可以根据使用场景动态调整,进一步提高了泛化性。
[0058]3、在训练的过程中使用主动学习的方法进行数据筛选,减少无关信息的干扰,增强模型的泛化性能。
[0059]4、结构简单,可移植性好。
附图说明
[0060]图1为本专利技术实施例一种伪造语音检测方法的流程示意图;
[0061]图2为本专利技术实施例主动学习流程示意图。
具体实施方式
[0062]当前伪造语音检测系统、鉴伪系统过度依赖传统的人工设计特征和深度神经网络的分类性能,没有针对伪造语音特点进行设计,导致模型与特定的数据集或特定的伪造方法密切相关,在实际应用场景中泛化性较差,难以实际部署。为了解决这个问题,本专利技术提出的伪造语音检测方法和装置,充分利用了伪造语音在基频处留下的痕迹信息,利用伪造语音与自然语音在基频处的差异强化伪造语音的鉴别,使得方法和装置具有较高的泛化性。
[0063]具体的,本专利技术实施例一种伪造语音检测方法的流程如图1所示,包括:
[0064]提取待检测语音信号的音频特征;提取待检测语音信号的基频微扰特征和振幅微扰特征;
[0065]通过卷积神经网络将音频特征转化为一维嵌入式特征;
[0066]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种伪造语音检测方法,其特征在于,包括:提取待检测语音信号的音频特征;提取待检测语音信号的基频微扰特征和振幅微扰特征;通过卷积神经网络将音频特征转化为一维嵌入式特征;将一维嵌入式特征、基频微扰特征和振幅微扰特征拼接在一起,得到一维隐式特征;将一维隐式特征输入分类网络确定待检测语音信号是否为伪造语音信号。2.根据权利要求1所述的方法,其特征在于,所述提取待检测语音信号的音频特征包括:对该语音信号进行预加重、分帧及加窗处理;对处理得到的各帧信号分别进行快速傅里叶变换,得到各帧信号的频域特征;将各帧信号的频域特征沿着频率轴拼接在一起,得到该语音信号的音频特征。3.根据权利要求1所述的方法,其特征在于,所述提取待检测语音信号的基频微扰特征和振幅微扰特征包括:对该语音信号进行预加重、分帧及加窗处理;分别计算处理得到的各帧信号的基音周期;取得到的基音周期的部分相邻的基音周期或全部;采用以下基频微扰特征的计算公式中的部分或全部,分别算得基频微扰特征:采用以下基频微扰特征的计算公式中的部分或全部,分别算得基频微扰特征:采用以下基频微扰特征的计算公式中的部分或全部,分别算得基频微扰特征:采用以下基频微扰特征的计算公式中的部分或全部,分别算得基频微扰特征:其中,J为所取的基音周期的数量,T(j)为所取的第j个基音周期的长度;采用以下振幅微扰特征的计算公式中的部分或全部,算得振幅微扰特征:
其中,A(j)为所取的第j个基音周期的峰间振幅。4.根据权利要求1、2或3所述的方法,其特征在于,所述将一维隐式特征输入分类网络前还包括:采用注意力机制将所述一维隐式特征转换为注意力值;所述将一维隐式特征输入分类网络为:将所述注意力值输入分类网络。5.根据权利要求1、2或3所述的方法,其特征在于,还包括:采用主动学习算法对所述卷积神经网络和分类网络进行训练。6.一种伪造语音检测装置,其特征在于,包括:第一预处理单元、第二预处理单元、卷积神经网络单元、拼接单元和分类网络单元;其...

【专利技术属性】
技术研发人员:张震孙旭东王立强杜金浩
申请(专利权)人:国家计算机网络与信息安全管理中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1