【技术实现步骤摘要】
一种基于后门攻击的数据集保护和验证方法
[0001]本专利技术属于互联网
,具体涉及一种基于后门攻击的数据集保护和验证方法。
技术介绍
[0002]近年来,深度神经网络在各个领域都取得了较为广泛的应用。其中数据集,特别是高质量的开源数据集是深度神经网络繁荣的关键因素。这些开源数据集让研究人员可以很容易地验证他们的算法或模型的有效性,而这一过程反过来又加速了深度学习的发展。数据集的收集耗费了大量资源,其价值不言而喻,所以现有的开源数据集基本都要求它们只能用于学术或教育目的,而不能用于商业目的。基于此背景,已经有人提出了一些数据集保护技术,如匿名化、加密和水印方法进行数据集保护,它们的目的是防止未经授权的用户访问数据集。
[0003]然而,以上所提到的数据集保护方法却并不适合保护开源数据集。因为许多开源数据集对每个人都是开放访问的,唯一的要求是它们只能用于学术或教育目的。因此,保护开源数据集的主要问题是验证它是否被用于训练第三方模型。
技术实现思路
[0004]针对上述数据集保护方法不适合保护开源数 ...
【技术保护点】
【技术特征摘要】
1.一种基于后门攻击的数据集保护和验证方法,其特征在于:包括下列步骤:S1、根据实际需求设置水印γ的比例;所述γ越小,则代表包含水印的数据所占比重越小,水印设置的越隐蔽,所述D
attack
为攻击样本数据集,所述D
train
为原始数据集;S2、根据S1所得的γ划分原始数据集为良性样本数据集D
benign
和攻击样本数据集D
attack
;所述x
i
为输入,y
i
为输出标签,且x
i
∈{0,
…
,255}
C
×
W
×
H
,y
i
={1,
…
,K};S3、为S2中划分后所得的攻击样本数据集D
attack
添加水印,得到处理后的攻击样本数据集D
modified
;S4、将处理后的攻击样本数据集D
modified
与良性样本数据集D
benign
混合,得到水印数据集D
watermarked
;所述D
watermarked
=D
benign
∪D
modified
。2.根据权利要求1所述的一种基于后门攻击的数据集保护和验证方法,其特征在于:所述S3中攻击样本数据集D
attack
添加水印的方法为:S3.1、设置y
t
={1,
…
,K}和t∈{0,
…
,255}
C
×
W
×
H
分别为目标标签和指定的触发器;S3.2、根据S3.1设置的目标...
【专利技术属性】
技术研发人员:潘晓光,王小华,焦璐璐,樊思佳,马彩霞,
申请(专利权)人:山西三友和智慧信息技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。