一种伪造语音检测方法和装置制造方法及图纸

技术编号：37547858 阅读：13 留言：0更新日期：2023-05-12 16:23

本发明专利技术涉及一种伪造语音检测方法，所述方法具体包括：提取待检测语音信号的音频特征；提取待检测语音信号的基频微扰特征和振幅微扰特征；通过卷积神经网络将音频特征转化为一维嵌入式特征；将一维嵌入式特征、基频微扰特征和振幅微扰特征拼接在一起，得到一维隐式特征；将一维隐式特征输入分类网络确定待检测语音信号是否为伪造语音信号。还涉及了装置，包括第一预处理单元、第二预处理单元、卷积神经网络单元、拼接单元和分类网络单元。本发明专利技术的方法和装置，具有较高的泛化性，能够应对实际应用场景中的多种来源的伪造语音攻击。应用场景中的多种来源的伪造语音攻击。应用场景中的多种来源的伪造语音攻击。

全部详细技术资料下载

【技术实现步骤摘要】
一种伪造语音检测方法和装置

[0001]本专利技术涉及伪造语音检测领域，尤其是一种伪造语音检测方法和装置。

技术介绍

[0002]21世纪以来，伴随着人工智能的蓬勃发展，许多任务都选择使用基于人工智能的自动化系统代替繁琐的人工操作，以避免枯燥重复的工作。随着深度学习技术的发展，自动说话人识别技术在近几年取得较大的进展，逐步走向实际应用场景，在数据安全、认证通过等方面发挥着重要作用。然而，一些特定的攻击手段可以骗过自动说话人验证系统，达到非法获得受保护系统授权的目的。这些攻击手段统称为语音欺骗攻击，常见的语音欺骗攻击包括录音回放、语音合成和语音转换。为了应对语音欺骗攻击对于自动说话人识别系统的重大威胁，近年来针对语音欺骗攻击的鉴伪系统的发展备受关注。然而虽然许多伪造语音检测方法被提出，但现有的伪造语音检测泛化能力低，难以实际部署。

技术实现思路

[0003]有鉴于此，本专利技术的主要目的在于提供一种伪造语音检测方法和装置，具有较高的泛化性，能够应对实际应用场景中的多种来源的伪造语音攻击。
[0004]为达到上述目的，一方面，本申请提供了一种伪造语音检测方法，包括：
[0005]提取待检测语音信号的音频特征；提取待检测语音信号的基频微扰特征和振幅微扰特征；
[0006]通过卷积神经网络将音频特征转化为一维嵌入式特征；
[0007]将一维嵌入式特征、基频微扰特征和振幅微扰特征拼接在一起，得到一维隐式特征；
[0008]将一维隐式特征输入分类网络确定待检测语音信号是否为...

【技术保护点】

【技术特征摘要】
1.一种伪造语音检测方法，其特征在于，包括：提取待检测语音信号的音频特征；提取待检测语音信号的基频微扰特征和振幅微扰特征；通过卷积神经网络将音频特征转化为一维嵌入式特征；将一维嵌入式特征、基频微扰特征和振幅微扰特征拼接在一起，得到一维隐式特征；将一维隐式特征输入分类网络确定待检测语音信号是否为伪造语音信号。2.根据权利要求1所述的方法，其特征在于，所述提取待检测语音信号的音频特征包括：对该语音信号进行预加重、分帧及加窗处理；对处理得到的各帧信号分别进行快速傅里叶变换，得到各帧信号的频域特征；将各帧信号的频域特征沿着频率轴拼接在一起，得到该语音信号的音频特征。3.根据权利要求1所述的方法，其特征在于，所述提取待检测语音信号的基频微扰特征和振幅微扰特征包括：对该语音信号进行预加重、分帧及加窗处理；分别计算处理得到的各帧信号的基音周期；取得到的基音周期的部分相邻的基音周期或全部；采用以下基频微扰特征的计算公式中的部分或全部，分别算得基频微扰特征：采用以下基频微扰特征的计算公式中的部分或全部，分别算得基频微扰特征：采用以下基频微扰特征的计算公式中的部分或全部，分别算得基频微扰特征：采用以下基频微扰特征的计算公式中的部分或全部，分别算得基频微扰特征：其中，J为所取的基音周期的数量，T(j)为所取的第j个基音周期的长度；采用以下振幅微扰特征的计算公式中的部分或全部，算得振幅微扰特征：
其中，A(j)为所取的第j个基音周期的峰间振幅。4.根据权利要求1、2或3所述的方法，其特征在于，所述将一维隐式特征输入分类网络前还包括：采用注意力机制将所述一维隐式特征转换为注意力值；所述将一维隐式特征输入分类网络为：将所述注意力值输入分类网络。5.根据权利要求1、2或3所述的方法，其特征在于，还包括：采用主动学习算法对所述卷积神经网络和分类网络进行训练。6.一种伪造语音检测装置，其特征在于，包括：第一预处理单元、第二预处理单元、卷积神经网络单元、拼接单元和分类网络单元；其...

【专利技术属性】
技术研发人员：张震，孙旭东，王立强，杜金浩，
申请(专利权)人：国家计算机网络与信息安全管理中心，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人