评估神经网络图像分类模型鲁棒性的方法及装置制造方法及图纸

技术编号：32823281 阅读：15 留言：0更新日期：2022-03-26 20:21

本发明专利技术公开了评估神经网络图像分类模型鲁棒性的方法及装置，该方法包括：S1：获取样本集，样本集内包括图像样本；S2：将样本集中任意的第一图像样本输入神经网络图像分类模型中，获取第一图像样本的特征图；S3：输入第一图像样本，通过热力图生成算法，基于神经网络图像分类模型和特征图，获取第一图像样本的热力图；S4：基于热力图，计算第一图像样本的敏感区域，并突出第一图像样本的敏感区域；S5：采用扰动算法对敏感区域进行扰动，得到第一对抗样本；S6：将第一对抗样本作为新的第一图像样本重复S3至S5得到最终第一对抗样本；S7：将最终第一对抗样本和初始第一图像样本组成样本对，用于评估神经网络图像分类模型的鲁棒性。用于评估神经网络图像分类模型的鲁棒性。用于评估神经网络图像分类模型的鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
评估神经网络图像分类模型鲁棒性的方法及装置

[0001]本专利技术实施例涉及神经网络领域，具体涉及一种评估神经网络图像分类模型鲁棒性的方法及装置。

技术介绍

[0002]随着深层神经网络(DNNs)模型的大规模应用，其安全性与稳定性也受到了广泛的关注。2013年，Szegedy等人研究发现深层神经网络模型容易受到对抗样本的攻击，这种攻击是基于在原始图像上添加微小的扰动，而这种扰动在人眼范围内不会产生较大影响，却可以干扰深层神经网络模型做出误判。于是，针对神经网络模型的安全性、鲁棒性评估也变得至关重要。

技术实现思路

[0003]为此，本专利技术实施例提供一种评估神经网络图像分类模型鲁棒性的方法及装置，以解决现有技术中用于检测鲁棒性的对抗样本针对性差、扰动较大且通用性差的问题。
[0004]为了实现上述目的，本专利技术的实施方式提供如下技术方案：
[0005]在本专利技术的实施方式的一个方面中，提供了一种评估神经网络图像分类模型鲁棒性的方法，所述方法包括：
[0006]步骤1：获取样本集，所述样本集内包括图像样本；
[0007]步骤2：将所述样本集中任意的第一图像样本输入所述神经网络图像分类模型中，获取所述第一图像样本的特征图；
[0008]步骤3：输入所述第一图像样本，通过热力图生成算法，基于所述神经网络图像分类模型和所述特征图，获取所述第一图像样本的热力图；
[0009]步骤4：基于所述热力图，计算所述第一图像样本的敏感区域，并突出所述第一图像样本的敏...

【技术保护点】

【技术特征摘要】
1.一种评估神经网络图像分类模型鲁棒性的方法，其特征在于，所述方法包括：步骤1：获取样本集，所述样本集内包括图像样本；步骤2：将所述样本集中任意的第一图像样本输入所述神经网络图像分类模型中，获取所述第一图像样本的特征图；步骤3：输入所述第一图像样本，通过热力图生成算法，基于所述神经网络图像分类模型和所述特征图，获取所述第一图像样本的热力图；步骤4：基于所述热力图，计算所述第一图像样本的敏感区域，并突出所述第一图像样本的敏感区域；步骤5：采用扰动算法对所述敏感区域进行扰动，得到第一对抗样本；步骤6：将所述第一对抗样本作为新的第一图像样本重复步骤3至步骤5得到最终第一对抗样本；步骤7：将所述最终第一对抗样本和初始所述第一图像样本组成样本对，用于评估神经网络图像分类模型的鲁棒性。2.根据权利要求1所述的方法，将所述样本集中任意的第一图像样本输入所述神经网络图像分类模型中，其特征在于，获得softmax层之前最后一个连接层输出的特征图。3.根据权利要求1所述的方法，其特征在于，所述热力图算法为LRP热力图生成算法，将所述第一图像样本与所述第一图像样本的原始分类标签作为LRP解释器的输入，以所述特征图为起点，利用所述神经网络图像分类模型的结构，反向传播其相关性R，生成预测类别的所述热力图。4.根据权利要求1所述的方法，其特征在于，步骤4中计算所述第一图像样本的敏感区域具体为：将生成的所述热力图的所有像素点求均值μ，将所述热力图中像素点的值大于所述均值μ的位置认为是所述第一图像样本的敏感区域z，其余位置认为是非敏感区域。5.根据权利要求4所述的方法，其特征在于，步骤4中突出所述第一图像样本的敏感区域具体为：设定二值化掩码m，将所述热力图中的敏感区域z的掩码值设置为1，其余区域的掩码值设置为0。6.根据权利要求5所述的方法，其特征在于，步骤5具体为：采用扰动算法，根据公式更新所述第一图像样本中敏感区域z的像素值；根据公式x
′
＝x
⊙
(1
‑
m)+z
⊙
...

【专利技术属性】
技术研发人员：何召阳，靳宇馨，刘乃海，李乾坤，刘兵，
申请(专利权)人：北京墨云科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人