一种语音对抗样本识别模型训练方法及系统技术方案

技术编号：33632727 阅读：14 留言：0更新日期：2022-06-02 01:39

本发明专利技术公开了一种语音对抗样本识别模型训练方法及系统，属于对抗样本识别领域。包括：获取音频数据集，包含正常和对抗音频数据；获取每一个音频数据在一定频率范围的频谱图，生成频谱特征；计算不同频率范围下的所有音频数据的Fratio值和Fratio累计值，得到关于采样频率的Fratio累计值的单调递增曲线f；根据单调递增曲线f设计滤波器组，并对音频数据集中的所有音频进行滤波操作；利用滤波后的音频数据集对语音对抗样本识别模型进行训练。本发明专利技术通过设计的滤波器组放大了正常音频数据与对抗音频数据的关键差异部分，为对抗样本的识别提供了新方法，且模型训练简单，在较少的训练代价下，具备较高的识别精度。具备较高的识别精度。具备较高的识别精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音对抗样本识别模型训练方法及系统

[0001]本专利技术涉及对抗样本识别领域，尤其涉及一种语音对抗样本识别模型训练方法及系统。

技术介绍

[0002]随着人工智能技术的不断发展，越来越多的基于人工智能技术的应用被广泛使用在了生活中，包括语音内容识别、智能助手等等。这类基于人工智能模型来处理业务需求的方法却拥有脆弱性，容易遭受语音对抗样本的攻击。语音对抗样本是一种在原始音频上叠加一个人耳难以察觉的扰动，造成人工智能模型识别的结果出错的一种攻击方式。
[0003]现有的识别语音对抗样本的方法大多是利用正常样本和对抗样本在时域或者频域上的微小差别进行的。但由于微小差异难以捕捉，直接使用深度学习网络的方式进行容易出现模型的训练成本过大的问题。

技术实现思路

[0004]本专利技术为了解决上述技术问题，提供了一种语音对抗样本识别模型训练方法及系统，通过利用音频数据的Fratio累计值设计滤波器组，放大了正常音频和对抗音频间的微小差距，使得模型训练的代价减小，训练速度快，精度高。
[0005]为实现上述目的，本专利技术的第一个目的在于提供一种语音对抗样本识别模型训练方法，包括：
[0006]步骤1：获取音频数据集，所述的音频数据集包含正常音频数据与对抗音频数据；
[0007]步骤2：设计音频的采样频率，得到音频数据集中每一个音频数据在(0
‑
m)频率范围的频谱图，根据离散的采样点生成频谱特征；m表示采样频率范围的最大值；
[0008]步骤3：计算不同...

【技术保护点】

【技术特征摘要】
1.一种语音对抗样本识别模型训练方法，其特征在于，包括：步骤1：获取音频数据集，所述的音频数据集包含正常音频数据与对抗音频数据；步骤2：设计音频的采样频率，得到音频数据集中每一个音频数据在(0
‑
m)频率范围的频谱图，根据离散的采样点生成频谱特征；m表示采样频率范围的最大值；步骤3：计算不同频率范围下的所有音频数据的Fratio值和Fratio累计值，得到关于采样频率的Fratio累计值的单调递增曲线f；步骤4：根据单调递增曲线f设计滤波器组，并对音频数据集中的所有音频进行滤波操作；步骤5：利用滤波后的音频数据集对语音对抗样本识别模型进行训练。2.根据权利要求1所述的语音对抗样本识别模型训练方法，其特征在于，所述的采样频率范围为0
‑
16k。3.根据权利要求1所述的语音对抗样本识别模型训练方法，其特征在于，所述的Fratio值的计算公式为：值的计算公式为：值的计算公式为：其中，表示第i类中第j个音频的频谱特征，j＝1,2,
…
,N，N表示音频数据集中第i类的音频数量，i＝1,2，分别对应正常类和对抗类；u
i
表示第i类中N个音频的频谱特征的均值，u表示全部音频的频谱特征的均值。4.根据权利要求3所述的语音对抗样本识别模型训练方法，其特征在于，所述的单调递增曲线f具体为：在(0
‑
m)频率范围内设置不同的采样频率(m1,m2,...,m
i
,...,m
n
),获取在(0
‑
m
i
)频率范围的频谱图，计算该频率范围下的所有音频数据的Fratio值，记作所述的Fratio累计值为遍历所有的(0
‑
m
i
)频率范围组合，得到不同...

【专利技术属性】
技术研发人员：徐文渊，冀晓宇，程雨诗，何睿文，高逸卓，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人