基于迭代优化的抗图像增强数据脱敏方法及系统技术方案

技术编号：39602649 阅读：11 留言：0更新日期：2023-12-03 20:02

本发明专利技术公开了一种基于迭代优化的抗图像增强的数据脱敏方法及系统

全部详细技术资料下载

【技术实现步骤摘要】
基于迭代优化的抗图像增强数据脱敏方法及系统

[0001]本专利技术属于人工智能安全领域，特别是涉及一种基于迭代优化噪声及图像增强策略
、
动态步长调整算法和非局部残差网络的抗图像增强的数据脱敏方法及系统
。

技术介绍

[0002]深度学习模型的成功主要归功于大规模的数据集，如
ImageNet
和
MS
‑
COCO。
然而，而在这些常用的数据集中，一些图像样本在数据收集者和图像所有者之间并没有相互协议
。
这引起了未经授权使用个人数据进行商业训练的隐私担忧，因为即使是黑盒深度学习模型也会泄露其训练数据的敏感信息
。
例如，从
GPT
‑2模型中可以推断出私人用户信息，包括姓名和电子邮箱地址
。
[0003]为了保护个人数据不被滥用，研究人员提出了不可学习样本的概念以保护私有数据不被用于训练
。
主要的原理是在图像中添加难以察觉的噪声，以在不降低图像感知质量的情况下消除从这些图像中学习到知识的可能
。
[0004]图像增强是一种常用的数据预处理技术，以提高模型训练性能
。
研究者发现不可学习的样本也容易受到图像增强的影响
。
例如使用传统
Emin
方法在
CIFAR
‑
10
数据集上测试结果表明，在具有图像增强的不可学习示例上训练的模型的测试精度比在未进行图像增强的不可...

【技术保护点】

【技术特征摘要】
1.
一种基于迭代优化的抗图像增强数据脱敏方法，其特征在于，包括以下步骤：步骤1，包括训练一个增强策略更新模型和一个噪声生成源模型；其中，模型和模型的结构均为深度神经网络，使用一部分干净样本预训练模型一定轮次以更新增强策略，在源模型中加入了非局部模块；步骤2，利用添加了噪音的扰动图像少量轮次训练增强策略更新模型；采用不同的图像增强策略来最大限度地提高扰动数据和使用增强的扰动数据的平均梯度之间的余弦相似性，求解最优增强策略；步骤3，步骤2求解的最优增强策略，对应的样本即增强扰动样本，使用增强扰动样本训练源模型，在每一轮训练后，利用图像梯度信息更新噪声，更新噪声视作一个
min
‑
min
二层优化问题，即最小化噪声，使其难以被人类视觉检测，并且不影响图像质量的同时让源模型在扰动图像上的损失尽可能小；检查更新后的扰动样本在源模型上的错误率是否小于设置阈值，若小于设置阈值则退出循环并输出最终的噪声，否则重新进入步骤2更新增强策略
。2.
根据权利要求1所述的基于迭代优化的抗图像增强数据脱敏方法，其特征在于：所述步骤1中非局部模块作为残差块连接到目标模型，采用高斯嵌入非局部模块的版本，在嵌入空间中计算高斯距离
。3.
根据权利要求1所述的基于迭代优化的抗图像增强数据脱敏方法，其特征在于：所述步骤1还包括初始化现有噪声为0，且噪声的尺寸与图片相同
。4.
根据权利要求1所述的基于迭代优化的抗图像增强数据脱敏方法，其特征在于：步骤2采用的增强策略，即在每一轮为每类样本选择一种特定的增强策略，具体而言，可以看作是一个增强数组，其中表示为第类选择的增强操作，将增强操作集定义为，幅度集设置为，更新增强策略如下：其中表示应用操作和幅度的增强，为从一...

【专利技术属性】
技术研发人员：杨德淞，何秉坤，王骞，龚雪鸾，
申请(专利权)人：武汉大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人