基于制造技术

技术编号:39735566 阅读:9 留言:0更新日期:2023-12-17 23:37
本发明专利技术提出了一种基于

【技术实现步骤摘要】
基于SWM的回放攻击检测方法、装置、电子设备、存储介质


[0001]本专利技术涉及语音安全
,特别涉及一种基于
SWM
的回放攻击检测方法

装置

电子设备

存储介质


技术介绍

[0002]声纹识别是通过自动扬声器验证
(ASV)
系统对不同说话人的声纹特征与相应的声纹模板进行相似性比对,从而实现说话人身份的鉴别,在各种生物识别场景得到了广泛的应用

但是,说在部署自动扬声器验证
(ASV)
系统时,可能会遇到三种类型的伪造攻击,包括语音合成

语音转换和回放攻击

回放攻击主要将一个合法客户端的实际声音的录音回放到
ASV
系统,在相关技术中,主要通过提取输入语音的频域特征进行回放攻击检测,但是回放攻击的声源来自于真实的合法用户,因此直接提取的语音频域特征与合法用户的参考频域特征较为相似,很容易造成误识别


技术实现思路

[0003]本专利技术旨在至少解决现有技术中存在的技术问题之一

为此,本专利技术提出一种基于
SWM
的回放攻击检测方法

装置

电子设备

存储介质,能够放大输入语音和样本语音之间的特征差异,提高回放攻击检测的准确性

[0004]第一方面,本专利技术实施例提供了一种基于
SWM
的回放攻击检测方法,包括:
[0005]获取待检测语音信号,对所述待检测语音信号进行
CQT
变换,得到频域语音信号;
[0006]提取所述频域语音信号每一帧的帧幅度频谱,通过计算全部的所述帧幅度频谱的平均值后,根据预设的目标频率区间获取目标幅度频谱;
[0007]根据所述目标幅度频谱的频域样本间距计算出每个所述频域样本的样本权重,根据所述样本权重和所述目标幅度频谱得到目标
SWM

[0008]从所述目标
SWM
中提取出目标
SWM CQCC

[0009]获取预设的
DNN
模型

预先标注好的训练数据和测试数据;
[0010]从所述测试数据中提取出测试
SWM CQCC

[0011]将所述目标
SWM CQCC、
所述训练数据和所述测试
SWM CQCC
输入所述
DNN
模型,获取所述
DNN
模型的输出的回放攻击检测结果,其中,所述输出结果用于指示所述待检测语音信号为真实语音或者回放语音

[0012]根据本专利技术的一些实施例,所述将所述目标
SWM CQCC、
所述训练数据和所述测试
SWM CQCC
输入所述
DNN
模型,包括:
[0013]将所述真实样本语音信号和所述回放样本语音信号进行频率对齐;
[0014]通过计算所述真实样本语音信号每一帧的幅度频谱的平均值后,根据所述目标频率区间获取真实样本幅度频谱;
[0015]通过计算所述回放样本语音信号每一帧的幅度频谱的平均值后,根据所述目标频率区间获取回放样本幅度频谱;
[0016]确定所述真实样本幅度频谱所对应的真实样本
SWM
,确定所述回放样本幅度频谱所对应的回放样本
SWM

[0017]从所述真实样本
SWM
中提取出真实样本
SWM CQCC
,从所述回放样本
SWM
中提取出回放样本
SWM CQCC

[0018]根据所述真实样本
SWM CQCC、
所述回放样本
SWM CQCC
和所述测试
SWM CQCC
训练所述
DNN
模型;
[0019]将所述目标
SWM CQCC
输入训练好的所述
DNN
模型,得到所述回放攻击检测结果

[0020]根据本专利技术的一些实施例,所述频域语音信号

所述真实样本语音信号和所述回放样本语音信号的频率范围为
OHz

8000Hz
,所述目标频率区间为0赫兹至
2600
赫兹,所述训练数据和测试数据来自于
ASVspoof 2017
训练集

[0021]根据本专利技术的一些实施例,所述根据所述真实样本
SWM CQCC、
所述回放样本
SWM CQCC
和所述测试
SWM CQCC
训练所述
DNN
模型,包括:
[0022]将所述真实样本
SWM CQCC
和所述回放样本
SWM CQCC
输入所述
DNN
模型进行训练;
[0023]根据所述测试
SWM CQCC
确定所述
DNN
模型的等错误率,当所述等错误率所表征的误警率和错误率相同,确定所述
DNN
模型完成训练

[0024]根据本专利技术的一些实施例,所述
DNN
模型包括输入层

输出层和两层隐藏层,所述输入层由输入特征向量的
11
帧上下文窗口组成,所述输出层的节点数为2,所述隐藏层的节点数为
512。
[0025]根据本专利技术的一些实施例,所述根据所述目标幅度频谱的频域样本间距计算出每个所述频域样本的样本权重,根据所述样本权重和所述目标幅度频谱得到目标
SWM
,通过以下公式得到:
[0026][0027]SWM

{(w)y1,
(w)y2,
...(w)y
κ

(w)y
κ
+1

...y
K
‑1,
y
K
}

[0028]其中,
w
为所述样本权重,
k
为频域样本间距的数量,
n
为预设的正整数,
Y
为所述目标幅度频谱,并且满足
Y

{y1,
y2,
...y
κ

y
κ
+1

...y
K
‑1,
y
K
}y
k
为第
k
个频域样本

[0029]根据本专利技术的一些实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于
SWM
的回放攻击检测方法,其特征在于,包括:获取待检测语音信号,对所述待检测语音信号进行
CQT
变换,得到频域语音信号;提取所述频域语音信号每一帧的帧幅度频谱,通过计算全部的所述帧幅度频谱的平均值后,根据预设的目标频率区间获取目标幅度频谱;根据所述目标幅度频谱的频域样本间距计算出每个所述频域样本的样本权重,根据所述样本权重和所述目标幅度频谱得到目标
SWM
;从所述目标
SWM
中提取出目标
SWM CQCC
;获取预设的
DNN
模型

预先标注好的训练数据和测试数据;从所述测试数据中提取出测试
SWM CQCC
;将所述目标
SWM CQCC、
所述训练数据和所述测试
SWM CQCC
输入所述
DNN
模型,获取所述
DNN
模型的输出的回放攻击检测结果,其中,所述输出结果用于指示所述待检测语音信号为真实语音或者回放语音
。2.
根据权利要求1所述的基于
SWM
的回放攻击检测方法,其特征在于,所述将所述目标
SWM CQCC、
所述训练数据和所述测试
SWM CQCC
输入所述
DNN
模型,包括:将所述真实样本语音信号和所述回放样本语音信号进行频率对齐;通过计算所述真实样本语音信号每一帧的幅度频谱的平均值后,根据所述目标频率区间获取真实样本幅度频谱;通过计算所述回放样本语音信号每一帧的幅度频谱的平均值后,根据所述目标频率区间获取回放样本幅度频谱;确定所述真实样本幅度频谱所对应的真实样本
SWM
,确定所述回放样本幅度频谱所对应的回放样本
SWM
;从所述真实样本
SWM
中提取出真实样本
SWM CQCC
,从所述回放样本
SWM
中提取出回放样本
SWM CQCC
;根据所述真实样本
SWM CQCC、
所述回放样本
SWM CQCC
和所述测试
SWM CQCC
训练所述
DNN
模型;将所述目标
SWM CQCC
输入训练好的所述
DNN
模型,得到所述回放攻击检测结果
。3.
根据权利要求2所述的基于
SWM
的回放攻击检测方法,其特征在于,所述频域语音信号

所述真实样本语音信号和所述回放样本语音信号的频率范围为
0Hz

8000Hz
,所述目标频率区间为0赫兹至
2600
赫兹,所述训练数据和测试数据来自于
ASVspoof 2017
训练集
。4.
根据权利要求2所述的基于
SWM
的回放攻击检测方法,其特征在于,所述根据所述真实样本
SWM CQCC、
所述回放样本
SWM CQCC
和所述测试
SWM CQCC
训练所述
DNN
模型,包括:将所...

【专利技术属性】
技术研发人员:李威夏梦苑占江邓越林泽楷
申请(专利权)人:广东科学技术职业学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1