基于目标定位的对抗攻击方法、装置、设备及存储介质制造方法及图纸

技术编号:32968345 阅读:19 留言:0更新日期:2022-04-09 11:28
本申请涉及人工智能技术领域,揭露了一种基于目标定位的对抗攻击方法、装置、设备及存储介质,所述方法包括:获取待处理图像;通过提取模型,对所述待处理图像进行热力点提取,得到所述待处理图像对应的目标类激活热力图;基于所述目标类激活热力图,确认目标类位置;根据所述目标类位置,计算对应的噪声扰动;将所述目标位置对应的噪声扰动添加到对应的所述目标类位置处后,进行多次迭代,得到对应的对抗样本;将所述对抗样本输入待攻击模型进行检测。本申请实现了提高对待攻击模型的攻击准确率以及攻击效果。率以及攻击效果。率以及攻击效果。

【技术实现步骤摘要】
基于目标定位的对抗攻击方法、装置、设备及存储介质


[0001]本申请涉及人工智能领域,尤其涉及一种基于目标定位的对抗攻击方法、装置、设备及存储介质。

技术介绍

[0002]随着深度学习技术的日益发展,人工智能行业也有了巨大的突破。人工智能模型的安全问题,也日趋得到AI从业者的重视。现阶段深度学习模型相关领域的安全性问题也还存在一定的局限性。在现有技术中,常通过直接对图片进行模糊处理或其他方式进行加噪,或者利用anchor框检测出目标类别的位置,对该位置进行简单的加噪等处理来得到攻击图片,根据该攻击图片对检测模型进行攻击,但现有技术的方案常存在攻击准确率较低的情况,因此,如何提高对待攻击模型的攻击准确率成为了亟待解决的问题。

技术实现思路

[0003]本申请提供了一种基于目标定位的对抗攻击方法、装置、设备及存储介质,以解决现有技术中对待攻击模型的攻击准确率的问题。
[0004]为解决上述问题,本申请提供了一种基于目标定位的对抗攻击方法,包括:
[0005]获取待处理图像;
[0006]通过提取模型,对所述待处理图像进行热力点提取,得到所述待处理图像对应的目标类激活热力图;
[0007]基于所述目标类激活热力图,确认目标类位置;
[0008]根据所述目标类位置,计算对应的噪声扰动;
[0009]将所述目标类位置对应的噪声扰动添加到对应的所述目标类位置后,进行多次迭代,得到对应的对抗样本;
[0010]将所述对抗样本输入待攻击模型进行检测。
[0011]进一步的,所述通过提取模型,对所述待处理图像进行热力点提取,得到所述待处理图像对应的目标类激活热力图包括:
[0012]通过所述提取模型中的卷积层对所述待处理图像进行卷积处理后,得到特征图;
[0013]所述特征图经过所述提取模型中的第一激活层,得到所述待处理图像对应所属类别的概率;
[0014]利用所述概率对所述特征图进行求偏导,得到偏导数;
[0015]通过所述提取模型中的池化层对所述偏导数进行全局平均,得到权重值;
[0016]基于所述权重值,对所述特征图进行加权求和后,再经所述提取模型中的第二激活层,得到所述目标类激活热力图。
[0017]进一步的,所述基于所述目标类激活热力图,确认目标类位置包括:
[0018]将所述目标类激活热力图与所述待处理图像进行叠加,得到中间图像;
[0019]将中间图像中的各像素点的数值与预设阈值进行判断,当所述像素点的数值大于
所述预设阈值时,则将所述像素点所处位置确定为所述目标类位置。
[0020]进一步的,所述根据所述目标类位置,计算对应的噪声扰动包括:
[0021]根据以下公式来计算所述目标类位置对应的噪声扰动:
[0022][0023]其中,η表示噪声扰动,α表示每次迭代图像像素更新的幅值,表示损失函数关于输入x求导得到的梯度,J()表示损失函数,θ表示模型的参数。
[0024]进一步的,所述将所述目标类位置对应的噪声扰动添加到对应的所述目标类位置后,进行多次迭代,得到对应的对抗样本包括:
[0025]将所述目标类位置对应的噪声扰动添加到对应的所述目标类位置处,得到迭代项;
[0026]利用迭代算法对所述迭代项进行多次迭代,得到所述对抗样本。
[0027]进一步的,所述利用迭代算法对所述迭代项进行多次迭代,得到所述对抗样本包括:
[0028]所述迭代算法根据以下公式对所述迭代项进行多次迭代,直至满足迭代次数要求,或者相邻两次迭代的得到的结果之间差距小于预设要求时,得到对应的对抗样本:
[0029][0030]其中,η表示噪声扰动,α表示每次迭代图像像素更新的幅值,表示损失函数关于输入x求导得到的梯度,J()表示损失函数,θ表示模型的参数,当N为1时,即表示迭代项,表示将最终的x
N+1
限制在x+S的扰动范围内。
[0031]为了解决上述问题,本申请还提供一种基于目标定位的对抗攻击装置,所述装置包括:
[0032]获取模块,用于获取待处理图像;
[0033]提取模块,用于通过提取模型,对所述待处理图像进行热力点提取,得到所述待处理图像对应的目标类激活热力图;
[0034]确认模块,用于基于所述目标类激活热力图,确认目标类位置;
[0035]噪声计算模块,用于根据所述目标类位置,计算对应的噪声扰动;
[0036]迭代模块,用于将所述目标类位置对应的噪声扰动添加到对应的所述目标类位置后,进行多次迭代,得到对应的对抗样本;
[0037]攻击模块,用于将所述对抗样本输入待攻击模型进行检测。
[0038]进一步的,所述提取模块包括:
[0039]卷积子模块,用于通过所述提取模型中的卷积层对所述待处理图像进行卷积处理后,得到特征图;
[0040]第一激活子模块,用于所述特征图经过所述提取模型中的第一激活层,得到所述待处理图像对应所属类别的概率;
[0041]计算子模块,用于利用所述概率对所述特征图进行求偏导,得到偏导数;
[0042]池化子模块,用于通过所述提取模型中的池化层对所述偏导数进行全局平均,得
到权重值;
[0043]第二激活子模块,用于基于所述权重值,对所述特征图进行加权求和后,再经所述提取模型中的第二激活层,得到所述目标类激活热力图。
[0044]为了解决上述问题,本申请还提供一种计算机设备,包括:
[0045]至少一个处理器;以及,
[0046]与所述至少一个处理器通信连接的存储器;其中,
[0047]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的基于目标定位的对抗攻击方法。
[0048]为了解决上述问题,本申请还提供一种非易失性的计算机可读存储介质,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如上所述的基于目标定位的对抗攻击方法。
[0049]根据本申请实施例提供的一种基于目标定位的对抗攻击方法、装置、设备及存储介质,与现有技术相比至少具有以下有益效果:
[0050]获取待处理图像,通过提取模型,对所述待处理图像进行热力点提取,得到所述待处理图像对应的目标类激活热力图,来判断目标位置,基于所述目标类激活热力图,确认目标类位置,根据所述目标类位置,计算对应的噪声扰动,实现对目标类位置进行加噪,将所述目标位置对应的噪声扰动添加到对应的所述目标类位置处后,进行多次迭代,得到对应的对抗样本,实现对待处理图像加噪完毕,且仅针对目标类位置进行加噪,将所述对抗样本输入待攻击模型进行检测,判断所述检测模型是否能检测出对抗样本,实现提高了对待攻击模型的攻击准确率的效果,且增强了攻击效果。
附图说明
[0051]为了更清楚地说明本申请中的方案,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于目标定位的对抗攻击方法,其特征在于,所述方法包括:获取待处理图像;通过提取模型,对所述待处理图像进行热力点提取,得到所述待处理图像对应的目标类激活热力图;基于所述目标类激活热力图,确认目标类位置;根据所述目标类位置,计算对应的噪声扰动;将所述目标类位置对应的噪声扰动添加到对应的所述目标类位置后,进行多次迭代,得到对应的对抗样本;将所述对抗样本输入待攻击模型进行检测。2.根据权利要求1所述的基于目标定位的对抗攻击方法,其特征在于,所述通过提取模型,对所述待处理图像进行热力点提取,得到所述待处理图像对应的目标类激活热力图包括:通过所述提取模型中的卷积层对所述待处理图像进行卷积处理后,得到特征图;所述特征图经过所述提取模型中的第一激活层,得到所述待处理图像对应所属类别的概率;利用所述概率对所述特征图进行求偏导,得到偏导数;通过所述提取模型中的池化层对所述偏导数进行全局平均,得到权重值;基于所述权重值,对所述特征图进行加权求和后,再经所述提取模型中的第二激活层,得到所述目标类激活热力图。3.根据权利要求1所述的基于目标定位的对抗攻击方法,其特征在于,所述基于所述目标类激活热力图,确认目标类位置包括:将所述目标类激活热力图与所述待处理图像进行叠加,得到中间图像;将中间图像中的各像素点的数值与预设阈值进行判断,当所述像素点的数值大于所述预设阈值时,则将所述像素点所处位置确定为所述目标类位置。4.根据权利要求1所述的基于目标定位的对抗攻击方法,其特征在于,所述根据所述目标类位置,计算对应的噪声扰动包括:根据以下公式来计算所述目标类位置对应的噪声扰动:其中,η表示噪声扰动,α表示每次迭代图像像素更新的幅值,表示损失函数关于输入x求导得到的梯度,J()表示损失函数,θ表示模型的参数。5.根据权利要求1所述的基于目标定位的对抗攻击方法,其特征在于,所述将所述目标类位置对应的噪声扰动添加到对应的所述目标类位置后,进行多次迭代,得到对应的对抗样本包括:将所述目标类位置对应的噪声扰动添加到对应的所述目标类位置处,得到迭代项;利用迭代算法对所述迭代项进行多次迭代,得到所述对抗样本。6.根据权利要求5所述的基于目标定位的对抗攻击方法,其特征在于,所述利用迭代算法...

【专利技术属性】
技术研发人员:张兴石强刘雨桐王国勋雷晓宇
申请(专利权)人:润联软件系统深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1