一种基于梯度的模型防御手段检测方法技术

技术编号:41740411 阅读:20 留言:0更新日期:2024-06-19 13:00
本发明专利技术提出的一种基于梯度的模型防御手段检测方法,属于人工智能对抗攻防、深度学习模型技术领域。包括:将原始样本作为初始检测样本,在第t轮迭代中,将当前检测样本进行图像处理防御生成防御样本;在图像处理防御结束后,分别计算检测样本与防御样本的梯度方向,并将检测样本的梯度取反;求检测样本的梯度与防御样本的梯度的矢量和,沿着梯度的方向移动当前检测样本,迭代结束后输出检测样本;将基于一种对抗防御算法生成的检测样本送入生成该检测样本的模型预测;如果检测样本被分类错误则认为该模型使用了上述对抗防御算法。本方法能够快速且准确地进行防御算法检测。

【技术实现步骤摘要】

本专利技术涉及一种基于梯度的模型防御手段检测方法,属于人工智能对抗攻防、深度学习模型。


技术介绍

1、近年来,随着深度学习技术在各个领域的广泛应用,深度学习模型自身的脆弱性引起了社会广泛关注,尤其是对抗性攻击问题。

2、对抗攻击是指通过对深度学习模型的输入进行微小但精心设计的修改以欺骗模型导致错误输出结果的恶意行为,而对抗防御则旨在提高模型对这些恶意输入的鲁棒性。一些恶意攻击者可能通过故意向深度学习模型添加微小、通常无法检测的扰动来欺骗模型,从而导致模型错误分类。这种对抗性攻击在使用深度学习技术的生物识别、医学诊断分析、自动驾驶等安全关键领域中造成了严重威胁,并可能导致较为严重的后果。

3、目前,对抗性学习领域的研究主要聚焦于设计更具鲁棒性的模型、更高性能的攻击算法以及防御算法。然而,在对模型应用的防御算法的检测方面,尚未有系统性的研究涉足。这一方向的研究空白可能导致对抗攻击威胁的进一步加剧,因此迫切需要扩展研究,以更全面、系统地理解和解决深度学习模型所面临的安全挑战。因此,本专利技术提出了一种基于梯度的模型防御手段检测方法。这是首本文档来自技高网...

【技术保护点】

1.一种基于梯度的模型防御手段检测方法,其特征在于,具体包括以下步骤:

2.如权利要求1所述的基于梯度的模型防御手段检测方法,其特征在于,所述步骤S2具体为:

3.如权利要求1或2所述的基于梯度的模型防御手段检测方法,其特征在于,所述S3具体包括以下步骤:

【技术特征摘要】

1.一种基于梯度的模型防御手段检测方法,其特征在于,具体包括以下步骤:

2.如权利要求1所述的基于梯度的模型防御手段检测方法,其...

【专利技术属性】
技术研发人员:郑军徐艾萱张达邱执孙家正
申请(专利权)人:北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1