基于制造技术

技术编号：39735566 阅读：9 留言：0更新日期：2023-12-17 23:37

本发明专利技术提出了一种基于

全部详细技术资料下载

【技术实现步骤摘要】
基于SWM的回放攻击检测方法、装置、电子设备、存储介质

[0001]本专利技术涉及语音安全
，特别涉及一种基于
SWM
的回放攻击检测方法
、
装置
、
电子设备
、
存储介质
。

技术介绍

[0002]声纹识别是通过自动扬声器验证
(ASV)
系统对不同说话人的声纹特征与相应的声纹模板进行相似性比对，从而实现说话人身份的鉴别，在各种生物识别场景得到了广泛的应用
。
但是，说在部署自动扬声器验证
(ASV)
系统时，可能会遇到三种类型的伪造攻击，包括语音合成
、
语音转换和回放攻击
。
回放攻击主要将一个合法客户端的实际声音的录音回放到
ASV
系统，在相关技术中，主要通过提取输入语音的频域特征进行回放攻击检测，但是回放攻击的声源来自于真实的合法用户，因此直接提取的语音频域特征与合法用户的参考频域特征较为相似，很容易造成误识别
。

技术实现思路

[0003]本专利技术旨在至少解决现有技术中存在的技术问题之一
。
为此，本专利技术提出一种基于
SWM
的回放攻击检测方法
、
装置
、
电子设备
、
存储介质，能够放大输入语音和样本语音之间的特征差异，提高回放攻击检测的准确性
。
[0004]第一方面，本专利技术实施例提供了一种基于...

【技术保护点】

【技术特征摘要】
1.
一种基于
SWM
的回放攻击检测方法，其特征在于，包括：获取待检测语音信号，对所述待检测语音信号进行
CQT
变换，得到频域语音信号；提取所述频域语音信号每一帧的帧幅度频谱，通过计算全部的所述帧幅度频谱的平均值后，根据预设的目标频率区间获取目标幅度频谱；根据所述目标幅度频谱的频域样本间距计算出每个所述频域样本的样本权重，根据所述样本权重和所述目标幅度频谱得到目标
SWM
；从所述目标
SWM
中提取出目标
SWM CQCC
；获取预设的
DNN
模型
、
预先标注好的训练数据和测试数据；从所述测试数据中提取出测试
SWM CQCC
；将所述目标
SWM CQCC、
所述训练数据和所述测试
SWM CQCC
输入所述
DNN
模型，获取所述
DNN
模型的输出的回放攻击检测结果，其中，所述输出结果用于指示所述待检测语音信号为真实语音或者回放语音
。2.
根据权利要求1所述的基于
SWM
的回放攻击检测方法，其特征在于，所述将所述目标
SWM CQCC、
所述训练数据和所述测试
SWM CQCC
输入所述
DNN
模型，包括：将所述真实样本语音信号和所述回放样本语音信号进行频率对齐；通过计算所述真实样本语音信号每一帧的幅度频谱的平均值后，根据所述目标频率区间获取真实样本幅度频谱；通过计算所述回放样本语音信号每一帧的幅度频谱的平均值后，根据所述目标频率区间获取回放样本幅度频谱；确定所述真实样本幅度频谱所对应的真实样本
SWM
，确定所述回放样本幅度频谱所对应的回放样本
SWM
；从所述真实样本
SWM
中提取出真实样本
SWM CQCC
，从所述回放样本
SWM
中提取出回放样本
SWM CQCC
；根据所述真实样本
SWM CQCC、
所述回放样本
SWM CQCC
和所述测试
SWM CQCC
训练所述
DNN
模型；将所述目标
SWM CQCC
输入训练好的所述
DNN
模型，得到所述回放攻击检测结果
。3.
根据权利要求2所述的基于
SWM
的回放攻击检测方法，其特征在于，所述频域语音信号
、
所述真实样本语音信号和所述回放样本语音信号的频率范围为
0Hz
至
8000Hz
，所述目标频率区间为0赫兹至
2600
赫兹，所述训练数据和测试数据来自于
ASVspoof 2017
训练集
。4.
根据权利要求2所述的基于
SWM
的回放攻击检测方法，其特征在于，所述根据所述真实样本
SWM CQCC、
所述回放样本
SWM CQCC
和所述测试
SWM CQCC
训练所述
DNN
模型，包括：将所...

【专利技术属性】
技术研发人员：李威，夏梦，苑占江，邓越，林泽楷，
申请(专利权)人：广东科学技术职业学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人