防御对抗样本攻击的图像分类方法、终端设备及存储介质技术

技术编号:31502493 阅读:27 留言:0更新日期:2021-12-22 23:22
本发明专利技术涉及防御对抗样本攻击的图像分类方法、终端设备及存储介质,该方法中包括:S1:采集原始图像和其对应的对抗样本;S2:构建图像分类模型,图像分类模型采用深度神经网络结构,并在深度神经网络中添加去噪模块,去噪模块包括非局部均值模块和自注意力机制模块;S3:将原始图片和对应的对抗样本混合后对图像分类模型进行训练;S4:采用训练后的图像分类模型对图像进行分类。本发明专利技术通过端到端的方式在卷积网络的中间层添加去噪模块来降低对抗图像的噪声扰动,去噪模块由非局部均值模块和自注意力机制模块相结合,能够达到去噪目的且能够与任意卷积层相衔接,从而提高模型的对抗鲁棒性,有效解决了对抗样本攻击深度学习系统存在的隐患。存在的隐患。存在的隐患。

【技术实现步骤摘要】
防御对抗样本攻击的图像分类方法、终端设备及存储介质


[0001]本专利技术涉及图像分类领域,尤其涉及一种防御对抗样本攻击的图像分类方法、终端设备及存储介质。

技术介绍

[0002]随着硬件能力的快速提升和大数据的发展,人工智能已被人们广泛应用于生活的方方面面。但是,新技术发展的同时也会带来新的挑战,如恶意场景下的模型攻击。因此针对深度学习算法的应用,研究者不仅要提高模型的计算速度、模型的准确率,模型对对抗样本的攻击防御能力也成为了评估模型性能的一项重要指标。
[0003]从攻击背景分析,对抗攻击可以分为白盒攻击、黑盒攻击以及灰盒攻击。白盒攻击指的是攻击者已掌握目标攻击模型的网络结构设计、网络权重和网络防御方法等信息;黑盒攻击指的是攻击者对目标攻击模型信息一无所知,仅通过模型的输入和输出来获取有限的模型内部信息,并对有限的信息进行分析设计攻击方案;灰盒攻击介于白盒攻击和黑盒攻击两者之间,攻击者只掌握目标攻击模型的部分信息,如只获取到目标攻击模型的网络结构信息,或只获取到目标攻击模型的网络权重。从攻击目的分析,对抗攻击可分为:定向攻击和非定本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种防御对抗样本攻击的图像分类方法,其特征在于,包括以下步骤:S1:采集原始图像和其对应的对抗样本;S2:构建图像分类模型,图像分类模型采用深度神经网络结构,并在深度神经网络中添加去噪模块,去噪模块包括非局部均值模块和自注意力机制模块;S3:将原始图片和对应的对抗样本混合后对图像分类模型进行训练;S4:采用训练后的图像分类模型对图像进行分类。2.根据权利要求1所述的防御对抗样本攻击的图像分类方法,其特征在于:原始图像的对抗样本采用深度学习攻击算法FGSM、DeepFool和C&W生成。3.根据权利要求1所述的防御对抗样本攻击的图像分类方法,其特征在于:图像分类模型中将深度神经网络中的浅层卷积输出的特征图x输入非局部均值模块,得到去噪特征图y,具体过程通过下式表示:其中,f(x
i
,x
j
)表示特征加权函数,C(x)表示归一化函数,x
i
、x
j
分别表示两个领域...

【专利技术属性】
技术研发人员:刘彩玲吴婷婷赵建强高志鹏张辉极杜新胜
申请(专利权)人:厦门市美亚柏科信息股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1