一种数据中毒攻击的检测和防御方法技术

技术编号:42478811 阅读:32 留言:0更新日期:2024-08-21 13:00
本发明专利技术公开了一种数据中毒攻击的检测和防御方法,其包括:对含毒化数据的训练数据集进行清洗,得到干净训练集;修复后门数据,构建触发器的拦截器来抵消后门触发的影响。本发明专利技术能够有效检测被毒化数据并对数据中毒攻击进行准确抵御,修复模型后门。

【技术实现步骤摘要】

本专利技术涉及数据安全,尤其涉及一种数据中毒攻击的检测和防御方法


技术介绍

1、算法决定智能模型性能的下限,数据决定智能模型性能的上限,如今数据扩充、特征选择等围绕数据的研究内容日趋成熟。而攻击者也将目光转向于此,联邦学习、开源数据等都成为他们精心编造毒化数据,实施数据中毒攻击的试验场。

2、数据中毒攻击的防御方法分为主动防御和被动防御。被动防御的特点是仅能在攻击行为发生后进行检测、清理和修复,是数据中毒攻击的“特效药”,主要采用基于训练检测的防御方法实现被动防御;主动防御的特点是更加侧重于防患于未然,在攻击发生前采取措施,强固分类模型自身的“保护体”,主要有基于鲁棒训练的防御方法和基于数据增强的防御方法。

3、(1)基于训练检测的防御方法

4、训练数据结合机器学习算法,得到疑似被毒化的分类模型,直接使用这个模型对每一个训练数据进行分类并计算标签,如果得到的标签与该数据的真实标签不同,则该数据为毒化的数据,将其从训练数据中删除。该方法简单实用,然而只能用于已知训练数据的检测,若是模型后门是由多个毒化数据合力导致,则无法本文档来自技高网...

【技术保护点】

1.一种数据中毒攻击的检测和防御方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述步骤1包括:

3.根据权利要求2所述的方法,其特征在于,采用如下公式计算含毒化数据的训练数据集:

4.根据权利要求2所述的方法,其特征在于,所述增加模型训练误差,包括:

5.根据权利要求2所述的方法,其特征在于,采用样本点对分类准确率的错误影响来决定是否将其用于训练分类模型,分类模型在毒化样本点上的分歧比在干净样本点上的分歧大,并用K-L散度来度量分类模型间的分歧,与遵循正态数据分布的正常数据样本相比,毒化数据样本的分歧更高。

...

【技术特征摘要】

1.一种数据中毒攻击的检测和防御方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述步骤1包括:

3.根据权利要求2所述的方法,其特征在于,采用如下公式计算含毒化数据的训练数据集:

4.根据权利要求2所述的方法,其特征在于,所述增加模型训练误差,包括:

5.根据权利要求2所述的方法,其特征在于,采用样本点对分类准确率的错误影响来决定是否将其用于训练分类模型,分类模型在毒化样本点上的分歧比在干净样本点上的分歧大,并用k-l散度...

【专利技术属性】
技术研发人员:李鉴石凯张锋军毛军鹏李庆华杨竞杜彪许杰张亮朱光明谢上明
申请(专利权)人:中国电子科技集团公司第三十研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1