一种基于捷径学习理论的图像数据保护方法和系统技术方案

技术编号:37974519 阅读:26 留言:0更新日期:2023-06-30 09:49
本发明专利技术提供一种基于捷径学习理论的图像数据保护的方法和系统,包括:针对图像分类任务,对图像数据按照标签进行类别划分,构建数据集;以扰动像素点与扰动像素值为优化目标,设计目标函数;基于所述目标函数,按所述类别计算每个扰动像素点与相应扰动像素值的得分;选取得分最高的扰动像素点与扰动像素值构建捷径,对该类别数据集内所有图像进行修改。本发明专利技术基于捷径学习理论,以单像素扰动的方式构建捷径,最小限度地改动图像数据,具有较佳的可见性与生成效率;同时用无任何语义信息的表征作为捷径特征,能更有效地在各种数据增强方法下保护数据的关键信息不容易被网络学习到。法下保护数据的关键信息不容易被网络学习到。法下保护数据的关键信息不容易被网络学习到。

【技术实现步骤摘要】
一种基于捷径学习理论的图像数据保护方法和系统


[0001]本专利技术涉及计算机视觉与数字图像处理领域,具体地,涉及一种基于捷径学习理论的图像数据保护方法和系统。

技术介绍

[0002]随着深度学习与计算机视觉技术的发展,对数据集的需求也日益增长。除了各机构发布的开源数据集之外,越来越多的企业也通过社交媒体等平台搜集用户数据用于深度学习模型的训练,这将带来用户隐私泄露的风险。
[0003]目前,图像数据保护方法的研究主要集中在数据投毒(Data Poisoning)领域,这些方法可以被归为两个大类:(1)修改部分数据,但不对修改强度做约束;(2)修改全部数据,同时约束修改强度,以保证修改后的数据的语义表征不被破坏,不影响正常观感。
[0004]第一类方法相对来说效果不佳,且通过数据清洗可以排除掉人为设置的投毒样本,从而使得深度神经网络在训练中能够学到正确的特征。第二种方法由于对修改强度进行了约束,被修改之后的数据在人眼看来与修改之前相差无几,因而不会受数据清洗的影响,但这类方法的普遍特性是生成的速度较慢,且在对抗训练下失去保护效果本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于捷径学习理论的图像数据保护的方法,其特征在于,包括:针对图像分类任务,对图像数据按照标签进行类别划分,构建数据集;以扰动像素点与扰动像素值为优化目标,设计目标函数;基于所述目标函数,按所述类别计算每个扰动像素点与相应扰动像素值的得分;选取得分最高的扰动像素点与扰动像素值构建捷径特征,对该类别数据集内所有图像进行修改。2.根据权利要求1所述的一种基于捷径学习理论的图像数据保护的方法,其特征在于,所述针对图像分类任务,对图像数据按照标签进行类别划分,构建数据集,包括:将所述图像数据中所有标签为k的样本划分到同一个数据子集3.根据权利要求1所述的一种基于捷径学习理论的图像数据保护的方法,其特征在于,所述优化目标:其中:k表示类别,σ
k
表示扰动像素位置,ξ
k
表示扰动的目标像素值,表示反映扰动影响力的目标函数;所述扰动像素位置σ
k
为与图像大小相同的稀疏矩阵,其中只有一个位置的元素值为1,其余元素值为0。4.根据权利要求3所述的一种基于捷径学习理论的图像数据保护的方法,其特征在于,使用所述反映扰动影响力的目标函数计算每个扰动像素点与相应扰动像素值的得分,其中,表示包含属于k类别的所有图像的数据子集,C表示图像的总通道数,x
j
表示图像x的第j通道,ξ
k,j
表示扰动的目标像素值ξ
k
的第j通道,代表在属于集合的所有样本上求期望值,代表在属于集合的所有样本上求方差。5.根据权利要求4所述的一种基于捷径学习理论的图像数据保护的方法,其特征在于,所述基于所述目标函数,按所述类别计算每个扰动像素点与相应扰动像素值的得分,包括:遍历搜索空间内的所有可行点;对每个可行点使用目标函数计算相应分数。6.根据权利要求5所述的一种基于捷径学习理...

【专利技术属性】
技术研发人员:吴枢同陈思哲杨杰黄晓霖
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1