一种针对图像分类模型的遗忘学习验证方法技术

技术编号：40044302 阅读：3 留言：0更新日期：2024-01-16 20:12

本发明专利技术公开了一种针对图像分类模型的遗忘学习验证方法，包括：向服务器提出图像遗忘请求，所述图像遗忘请求用于要求服务器遗忘图像分类模型中的隐私图像数据；服务器响应于图像遗忘请求作出相应的遗忘学习操作；用户针对遗忘学习操作分别进行遗忘图像类别验证、遗忘图像数量验证以及遗忘图像存在性验证，本发明专利技术分别从类别级、数量级、样本级三级粒度下实现了遗忘图像类别验证、遗忘图像数量验证、遗忘图像存在性验证。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及深度学习图像分类和遗忘学习领域，具体为一种遗忘学习验证方法。

技术介绍

1、深度学习作为实现人工智能的一种重要方法，通过使用海量训练数据构建深度学习模型，学习样本数据的内在规律和表示层次，获得强大的数据特征学习能力，在图像分类领域发挥着不可或缺的作用。但图像分类模型训练过程中需要使用大量用户图像数据，其中可能包含用户的隐私信息。因此，随着隐私意识的增强，用户图像数据遗忘的需求也越来越迫切。由于世界范围内越来越多的法律法规赋予用户数据遗忘权，允许用户要求模型持有者删除模型中关于自身图像数据的部分，因此，遗忘学习技术被提出。遗忘学习最直接的方法是，服务器删除训练集中用户提出遗忘的数据后重新训练整个模型，这个方式虽然有效，但是却要承担巨大的计算开销，尤其是当图像分类模型规模庞大时，完全重训练模型是不现实的。于是，现有的遗忘学习框架致力于降低重训练的计算开销，根据遗忘的方式分为精确遗忘和近似遗忘。其中精确遗忘的核心思想是依旧使用重训练的方式进行数据遗忘，但是通过将训练集进行分块，只重训练部分数据来降低计算开销，近似遗忘是通过修改模型参数，使模型在参数空间接近精确遗忘后的模型，从而移除数据在模型中的影响。遗忘学习的一般流程是，用户向服务器提出遗忘请求，包含遗忘的目标图像类别，遗忘图像数量，以及遗忘目标图像样本。服务器收到用户的图像遗忘请求后，采用精确遗忘或近似遗忘对初始图像分类模型进行处理，得到遗忘图像分类模型后返回给用户。但在这个过程中，可能会存在恶意服务器欺骗用户的行为。由于服务器试图节省算力或者想要在模型中保留用户隐私

技术实现思路

1、本专利技术的目的在于提出了一种针对图像分类模型的遗忘学习验证方法。

2、实现本专利技术目的的技术方案为：一种针对图像分类模型的遗忘学习验证方法，包括：

3、向服务器提出图像遗忘请求，所述图像遗忘请求用于要求服务器遗忘图像分类模型中的隐私图像数据，所述隐私图像数据包括图像类别、图像数量以及图像样本；

4、服务器响应于图像遗忘请求，对图像分类模型利用遗忘学习技术针对遗忘请求中所述隐私图像数据进行移除，并将遗忘后的图像分类模型发送给验证者；

5、验证者接收以遗忘图像分类模型后分别进行遗忘图像类别验证、遗忘图像数量验证以及遗忘图像存在性验证。

6、优选地，遗忘图像类别验证的具体过程为：

7、提取图像分类模型敏感度，包括提取初始图像分类模型和遗忘图像分类模型的模型敏感度；

8、验证者据用户遗忘请求中的目标图像类别分别将初始图像分类模型和遗忘图像分类模型的模型敏感度进行匹配，根据匹配结果判定服务器是否遗忘相应类别数据。

9、优选地，提取初始图像分类模型敏感度的具体步骤为：

10、利用测试数据集dtest重新训练初始图像分类模型θo，得到重训练后的初始图像分类模型θ′o，具体计算公式为：

11、θ′o＝θo.train(dtest,α)

12、式中，α为学习率；

13、对于重训练后的初始图像分类模型θ′o中的每个神经元参数进行累加，得到对应类别c的模型敏感度具体计算公式为：

14、

15、

16、式中，l(·)为损失函数，θi为每个神经元对应的模型参数值。

17、优选地，提取遗忘图像分类模型敏感度，具体步骤为：

18、利用测试数据集dtest重新训练遗忘图像分类模型，得到重训练后的遗忘图像分类模型θ′u，具体计算公式为：

19、θ′u＝θ′u.train(dtest,α)

20、式中，α为学习率；

21、步骤2.2、对于θ′u中的每个神经元参数进行累加，得到对应类别c的模型敏感度具体计算公式为：

22、

23、

24、式中，l(·)为损失函数，θi为每个神经元对应的模型参数值。

25、优选地，将初始图像分类模型和遗忘图像分类模型的模型敏感度进行匹配，根据匹配结果判定服务器是否遗忘相应类别数据的具体方法为：

26、将初始图像分类模型和遗忘图像分类模型的模型敏感度的差值的绝对值与设定的模型敏感度差值阈值进行比较，如果初始图像分类模型和遗忘图像分类模型的模型敏感度的差值的绝对值小于设定的模型敏感度差值阈值，则表明服务器并未遗忘该类别数据，服务器并未对遗忘请求中的目标图像数据进行任何遗忘操作，判定该服务器为忽视型服务器，否则，则表明服务器确实遗忘了该类别数据。

27、优选地，遗忘图像数量验证的具体方法为：

28、步骤1、增量划分训练图像数据集，验证者根据遗忘请求中的目标图像类别c增量划分训练图像数据集dtar为n个影子图像数据集，具体计算公式为：

29、

30、并记录增量图像样本数volbatch，同时记录遗忘请求中的目标样本数量voltar。

31、步骤2、训练影子图像分类模型，对每个影子图像数据集进行训练，得到多个影子图像分类模型θshadown，并提取每个影子模型的图像分类模型敏感度，具体计算公式为：

32、

33、式中，α为学习率；

34、步骤3、测算图像遗忘度量，具体为：

35、步骤3.1、验证者计算影子模型敏感度差值，具体计算公式为：

36、

37、式中，和分别表示第n个和第n+1个影子模型中类别c的模型敏感度。

38、步骤3.2、验证者根据增量图像样本数测算出图像遗忘度量，具体计算公式为：

39、

40、式中，表示取所有影子模型中类别c的模型敏感度差值之和，n为影子模型数量

41、步骤4、推断遗忘图像数量，具体为：

42、验证者提取初始图像分类模型敏感度和遗忘图像分类模型的模型敏感度；

43、计算初始图像分类模型敏感度和遗忘图像分类模型敏感度的模型敏感度差dsc，具体计算公式为：

44、

45、式中，表示遗忘图像分类模型中类别c的模型敏感度，表示初始图像分类模型中类别c的模型敏感度。

46、根据图像遗忘度量推断模型敏感度差值对应的图像数量，具体计算公式为：

47、

48、式中，tvolume为验证者设置的样本数量差值阈值，dsc为计算得到的模型敏感度差，为图像遗忘度量，volbatch为增量图像样本数

49、如果|voltar-volinf|＞tvolume，则表明服务器遗忘的图像样本数量没有达到本文档来自技高网...

【技术保护点】

1.一种针对图像分类模型的遗忘学习验证方法，其特征在于，包括：

2.根据权利要求1所述的针对图像分类模型的遗忘学习验证方法，其特征在于，遗忘图像类别验证的具体过程为：

3.根据权利要求2所述的针对图像分类模型的遗忘学习验证方法，其特征在于，提取初始图像分类模型敏感度的具体步骤为：

4.根据权利要求2所述的针对图像分类模型的遗忘学习验证方法，其特征在于，提取遗忘图像分类模型敏感度，具体步骤为：

5.根据权利要求2所述的针对图像分类模型的遗忘学习验证方法，其特征在于，将初始图像分类模型和遗忘图像分类模型的模型敏感度进行匹配，根据匹配结果判定服务器是否遗忘相应类别数据的具体方法为：

6.根据权利要求1所述的针对图像分类模型的遗忘学习验证方法，其特征在于，遗忘图像数量验证的具体方法为：

7.根据权利要求1所述的针对图像分类模型的遗忘学习验证方法，其特征在于，遗忘图像存在性验证的具体方法为：

8.根据权利要求1所述的针对图像分类模型的遗忘学习验证方法，其特征在于，所述隐私图像数据包括图像类别、图像数量以及图像样本。

...

【技术特征摘要】

1.一种针对图像分类模型的遗忘学习验证方法，其特征在于，包括：

2.根据权利要求1所述的针对图像分类模型的遗忘学习验证方法，其特征在于，遗忘图像类别验证的具体过程为：

3.根据权利要求2所述的针对图像分类模型的遗忘学习验证方法，其特征在于，提取初始图像分类模型敏感度的具体步骤为：

4.根据权利要求2所述的针对图像分类模型的遗忘学习验证方法，其特征在于，提取遗忘图像分类模型敏感度，具体步骤为：

5.根据权利要求2所述的针对图像分类模型的遗忘学习验证方法...

【专利技术属性】
技术研发人员：付安民，周纯毅，况博裕，苏铓，俞研，
申请(专利权)人：南京理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人