一种基于深度语音波形先验的对抗样本还原方法技术

技术编号：39139360 阅读：14 留言：0更新日期：2023-10-23 14:54

本发明专利技术公开了一种即插即用的动态对抗样本防御方法——LowDDAWP

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度语音波形先验的对抗样本还原方法

[0001]本专利技术涉及一种基于深度语音波形先验的对抗样本还原方法，属于计算机语音识别

技术介绍

[0002]随着深度学习技术的发展，研究者们开始将深度学习应用于语音识别中。深度学习技术可以自动学习语音信号的特征，显著提高了语音识别的准确率和鲁棒性。因此，自动语音识别技术开始融入不同的领域，如智能家居、智能汽车、智能机器人等等，使人们的生产和生活更加高效、便捷。然而，近期的研究表明，通过向良性样本上添加黑客精心制作的对抗扰动就可以生成使ASR系统做出错误判决的对抗样本，并且在人类感知上二者几乎没有任何差别。这些语音对抗样本不仅可以使受害模型做出错误分类，甚至使受害模型将其转录成攻击者所期望的目标结果，从而对相关应用(如语音助手、语音验证码等)造成安全隐患。
[0003]当前对语音对抗样本的防御研究主要停留在检测防御上，只有少数研究针对对抗样本进行还原，而一个鲁棒的ASR系统的目标应该是对任意样本都能正确转录，而不仅仅是检测对抗样本并拒绝服务。并且现有的还原防御对对抗样本的还原性能较低且对良性样本的影响较大，还需要对目标模型进行更改，同时现有的防御研究所提出的防御模块参数基本固定，一旦通过梯度估计等方式获得了固定的参数就会被再次攻破。
[0004]本专利技术针对现有问题，提出了LowDDAWP
‑
Net算法，实现了对对抗样本的动态防御。该方法基于深度语音波形先验理论对对抗样本进行还原，并且设计了低分辨率信息提取模块，加快了LowD

【技术保护点】

【技术特征摘要】
1.一种基于深度语音波形先验的对抗样本还原方法，其特征在于，所述方法具体步骤如下：步骤1，将良性样本或者对抗样本输入到LowDDAWP
‑
Net算法中，旨在对良性样本处理后不会影响其转录，而对抗样本的转录会恢复为良性转录，使用语音活动检测算法将输入的语音分割为语音活动片段(即话语片段)和包含大量对抗扰动和噪声信息的静音片段；步骤2，将得到的噪音片段作为对抗扰动拟合网络(DAWP
noise
)的标签，以随机生成的高斯噪声作为网络的输入，获得拟合的对抗扰动音频；步骤3，将得到的话语片段作为话语信息拟合网络(DAWP
speec
h)的标签；以随机生成的高斯噪声作为网络的输入，并且使用AMR算法和Logmmse_SPU
‑
cohen增强算法构成的低分辨率信息提取模块提取包含话语结构的低分辨率音频，在低分辨率音频的基础之上，DAWP
speec
h拟合良性音频；步骤4，拟合的对抗扰动音频和拟合的良性音频的加和拟合给定的对抗样本，LowDDAWP
‑
Net算法输出DAWP
speec
h拟合的良性音频，即为给定的对抗样本防御后的良性样本估计。2.根据权利要求1所述的一种基于深度语音波形先验的对抗样本还原方法，其特征在于，在算法的防御阶段，有两个DAWP网络需要实时训练，包括DAWP
speec
h和DAWP
noise
，两个DAWP网络的结构和输入完全相同，输入的都是均值为0、方差为0.1的随机高斯噪声；网络结构为U型的编码器和解码器结构，解码器由6个卷积编码块和一个单层双向的LSTM块组成；编码器为6个卷积解码块组成，其中，每个卷积编码块由两个一维卷积层组成，第...

【专利技术属性】
技术研发人员：陈阳，陈凯，汪哲贤，
申请(专利权)人：东南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人