【技术实现步骤摘要】
【国外来华专利技术】一种用于隐藏原始数据以保护个人信息的混淆网络的学习方法和测试方法,以及其学习装置和测试装置
本专利技术涉及一种用于隐藏(Concealing)原始数据以保护个人信息的混淆网络的学习方法以及其学习装置,并还涉及一种用于隐藏原始数据以保护个人信息的学习的混淆网络的测试方法以及其测试装置。
技术介绍
大数据(BigData)是指包括现有企业环境或公共机构中使用的所有结构化数据以及尚未使用的所有非结构化或半结构化数据的数据,例如电子商务数据、元数据、Web日志数据、射频识别(RFID,RadioFrequencyIdentification)数据、传感器网络数据、社交网络数据、互联网文本和文档上的数据、互联网搜索索引数据等。从普通软件工具和计算机系统难以处理如此大量数据的意义上来说,此类数据通常被称为大数据。大数据本身可能毫无意义,但如果对模式等进行机器学习,则对在各个领域中生成新数据或做出判断或预测会很有用。近年来,由于加强了《个人信息保护法》等,因此为了交易或共享这样的大数据,需要从该数据中删除个人可识别信息或者获得该个人的同意。然而,不仅难以一一检查大量大数据中是否存在个人可识别信息,而且还无法获得每个人的同意,因此支持解决这一问题的各种技术正在出现。作为相关现有技术的一例,可以举出例如韩国注册专利公报第1861520号中公开的技术,该技术提供了一种面部隐藏方法,其包括:检测步骤,其用于检测要变换的输入图像中人的面部区域;第一隐藏步骤,其将所检测到的面部区域转换为不具有人脸形状的变形的第 ...
【技术保护点】
1.一种用于隐藏原始数据以保护个人信息的混淆网络的学习方法,所述方法包括:/n(a)当获取训练数据时,学习装置将所述训练数据输入到混淆网络中,以使所述混淆网络对所述训练数据进行混淆,从而生成混淆的训练数据;/n(b)所述学习装置(i)将所述混淆的训练数据输入到具有至少一个学习参数的学习网络中,以使所述学习网络(i-1)用所述学习参数将网络运算应用于所述混淆的训练数据,(i-2)从而生成与所述混淆的训练数据相对应的第1特征信息,(ii)并将所述训练数据输入到所述学习网络中,以使所述学习网络(ii-1)用所述学习参数将网络运算应用于所述训练数据,(ii-2)从而生成与所述训练数据相对应的第2特征信息;以及/n(c)所述学习装置学习所述混淆网络,(i)以对通过参考(i-1)将所述第1特征信息和所述第2特征信息作为参考而获得的至少一个第1_1错误与(i-2)将使用所述第1特征信息来生成的任务特定输出和与所述任务特定输出对应的至少一个真实数据作为参考而获得的至少一个第1_2错误中的至少一部分来计算出的至少一个第1错误进行最小化,(ii)并对通过参考所述训练数据和所述混淆的训练数据来计算出的至少一 ...
【技术特征摘要】
【国外来华专利技术】20180726 KR 10-2018-00869291.一种用于隐藏原始数据以保护个人信息的混淆网络的学习方法,所述方法包括:
(a)当获取训练数据时,学习装置将所述训练数据输入到混淆网络中,以使所述混淆网络对所述训练数据进行混淆,从而生成混淆的训练数据;
(b)所述学习装置(i)将所述混淆的训练数据输入到具有至少一个学习参数的学习网络中,以使所述学习网络(i-1)用所述学习参数将网络运算应用于所述混淆的训练数据,(i-2)从而生成与所述混淆的训练数据相对应的第1特征信息,(ii)并将所述训练数据输入到所述学习网络中,以使所述学习网络(ii-1)用所述学习参数将网络运算应用于所述训练数据,(ii-2)从而生成与所述训练数据相对应的第2特征信息;以及
(c)所述学习装置学习所述混淆网络,(i)以对通过参考(i-1)将所述第1特征信息和所述第2特征信息作为参考而获得的至少一个第1_1错误与(i-2)将使用所述第1特征信息来生成的任务特定输出和与所述任务特定输出对应的至少一个真实数据作为参考而获得的至少一个第1_2错误中的至少一部分来计算出的至少一个第1错误进行最小化,(ii)并对通过参考所述训练数据和所述混淆的训练数据来计算出的至少一个第2错误进行最大化。
2.根据权利要求l所述的方法,其中,
所述学习网络包括具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,当所述n为1或更大的整数时,
在所述步骤(b)中,
所述学习装置(i)将所述混淆的训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(i-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述混淆的训练数据,(i-2)从而输出关于所述混淆的训练数据的每个第1_1特征信息至第1_n特征信息,(ii)并将所述训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(ii-1)用每个所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述训练数据,(ii-2)从而输出关于所述训练数据的每个第2_1特征信息至第2_n特征信息,
在所述步骤(c)中,
所述学习装置学习所述混淆网络,(i)以对通过参考(i-1)将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的第(1_1)_1错误至将所述第1_n特征信息和所述第2_n特征信息作为参考而获得的第(1_1)_n错误的平均值的所述第1_1错误与(i-2)(i-2a)将用所述第1_1特征信息生成的至少一个第1任务特定输出和(i-2b)与所述第1任务特定输对应的至少一个第1真实数据作为参考而获得的第(1_2)_1错误至(i-2a)将用所述第1_n特征信息生成的至少一个第n任务特定输出和(i-2b)与所述第n任务特定输出对应的至少一个第n真实数据作为参考而获得的第(1_2)_n错误的平均值的所述第1_2错误中至少一部分来计算出的所述第1错误进行最小化,(ii)并对通过参考所述训练数据和所述混淆的训练数据来计算出的所述第2错误进行最大化。
3.根据权利要求l所述的方法,其中,
所述学习网络包括具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,当所述n为1或更大的整数时,
在所述步骤(a)中,
所述学习装置将所述训练数据输入到所述混淆网络中,以使所述混淆网络对所述训练数据进行混淆,从而生成第1混淆的训练数据,
在所述步骤(b)中,
所述学习装置(i)将所述第1混淆的训练数据输入到所述第1学习网络中,以使所述第1学习网络(i-1)用所述第1学习网络的所述第1学习参数将网络运算应用于所述第1混淆的训练数据,(i-2)从而输出与所述第1混淆的训练数据相对应的第1_1特征信息,(ii)并将所述训练数据输入到所述第1学习网络中,以使所述第1学习网络(ii-1)用所述第1学习参数将网络运算应用于所述训练数据,(ii-2)从而输出与所述训练数据相对应的第2_1特征信息,
在所述步骤(c)中,
所述学习装置学习所述混淆网络,(i)以对通过参考(i-1)将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的至少一个第(1_1)_1错误与(i-2)将用所述第1_1特征信息生成的至少一个第1任务特定输出和与所述第1任务特定输出对应的至少一个第1真实数据作为参考而获得的至少一个第(1_2)_1错误中至少一部分来计算出的至少一个第1_1错误进行最小化,(ii)并对通过参考所述训练数据和所述第1混淆的训练数据来计算出的至少一个所述第2_1错误进行最大化,从而使所述混淆网络成为第1学习的混淆网络,
所述学习装置在将整数k从2增加到n的同时,(i)将所述训练数据输入到所述第k-1学习的混淆网络中,以使所述第k-1学习的混淆网络对所述训练数据进行混淆,从而生成第k混淆的训练数据,(ii)(ii-1)将所述第k混淆的训练数据输入到第k学习网络中,以使所述第k学习网络用所述第k学习网络中至少一个第k学习参数将网络运算应用于所述第k混淆的训练数据,从而输出关于所述第k混淆的训练数据的第1_k特征信息,(ii-2)将所述训练数据输入到所述第k学习网络中,以使所述第k学习网络用所述第k学习参数将网络运算应用于所述训练数据,从而输出关于所述训练数据的第2_k特征信息,(iii)学习所述第k-1学习的混淆网络,(iii-1)以对通过参考(iii-1a)将所述第1_k特征信息和所述第2_k特征信息作为参考而获得的至少一个第(1_1)_k错误与(iii-1b)将用所述第1_k特征信息生成的至少一个第k任务特定输出和与所述第k任务特定输出对应的至少一个第k真实数据作为参考而获得的至少一个第(1_2)_k错误中至少一部分来计算出的至少一个第1_k错误进行最小化,(iii-2)并对通过参考所述训练数据和所述第k混淆的训练数据来计算出的至少一个所述第2_k错误进行最大化,从而使所述k-1学习的混淆网络成为第k学习的混淆网络。
4.根据权利要求l所述的方法,其中,
在所述步骤(c)中,
在获得与输入到鉴别器的所述混淆的训练数据相对应的至少一个混淆的训练数据分数作为所述第2错误的状态下,其中所述鉴别器鉴别所输入数据的真实性,所述学习装置(i)在学习所述混淆网络以最小化所述第1错误并最大化第2错误的同时,(ii)学习所述鉴别器,以对与输入到所述鉴别器的修改训练数据或混淆的修改训练数据相对应的至少一个修改训练数据分数或至少一个混淆的修改训练数据分数进行最大化,并对所述混淆的训练数据分数进行最小化,其中所述修改训练数据或所述混淆的修改训练数据为分别通过修改所述训练数据或所述混淆的训练数据而生成的数据。
5.根据权利要求4所述的方法,其中,
所述学习网络包括具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,当所述n为1或更大的整数时,
在所述步骤(b)中,
所述学习装置(i)将所述混淆的训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(i-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述混淆的训练数据,(i-2)从而输出关于所述混淆的训练数据的每个第1_1特征信息至第1_n特征信息,(ii)并将所述训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(ii-1)用每个所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述训练数据,(ii-2)从而输出关于所述训练数据的每个第2_1特征信息至第2_n特征信息,
在所述步骤(c)中,
所述学习装置(i)学习所述混淆网络,以对通过参考(i-1)将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的第(1_1)_1错误至将所述第1_n特征信息和所述第2_n特征信息作为参考而获得的第(1_1)_n错误的平均值的所述第1_1错误与(i-2)(i-2a)将用所述第1_1特征信息生成的至少一个第1任务特定输出和(i-2b)与所述第1任务特定输出对应的至少一个第1真实数据作为参考而获得的第(1_2)_1错误至(i-2a)将用所述第1_n特征信息生成的至少一个第n任务特定输出和(i-2b)与所述第n任务特定输出对应的至少一个第n真实数据作为参考而获得的第(1_2)_n错误的平均值的所述第1_2错误中至少一部分来计算出的所述第1错误进行最小化,且对作为与输入到所述鉴别器的所述混淆的训练数据相对应的所述混淆的训练数据分数的所述第2错误进行最大化,(ii)并且学习所述鉴别器,以对与输入到所述鉴别器的所述修改训练数据或所述混淆的修改训练数据相对应的所述修改训练数据分数或所述混淆的修改训练数据分数进行最大化且对所述混淆的训练数据分数进行最小化。
6.根据权利要求4所述的方法,其中,
所述学习网络包括分别具有第1学习参数至第n学习参数的第1学习网络至第n学习网络,其中,当所述n为1或更大的整数时,
在所述步骤(a)中,
所述学习装置将所述训练数据输入到所述混淆网络中,以使所述混淆网络对所述训练数据进行混淆,从而生成第1混淆的训练数据,
在所述步骤(b)中,
所述学习装置(i)将所述第1混淆的训练数据输入到所述第1学习网络中,以使所述第1学习网络(i-1)用所述第1学习网络的所述第1学习参数将网络运算应用于所述第1混淆的训练数据,(i-2)从而输出与所述第1混淆的训练数据相对应的第1_1特征信息,(ii)并将所述训练数据输入到所述第1学习网络中,以使所述第1学习网络(ii-1)用所述第1学习参数将网络运算应用于所述训练数据,(ii-2)从而输出与所述训练数据相对应的第2_1特征信息,
在所述步骤(c)中,
所述学习装置学习所述混淆网络,(i)以对通过参考(i-1)将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的至少一个第(1_1)_1错误与(i-2)(i-2a)将用所述第1_1特征信息生成的至少一个第1任务特定输出和(i-2b)与所述第1任务特定输出对应的至少一个第1真实数据作为参考而获得的第(1_2)_1错误中至少一部分来计算出的至少一个第1_1错误进行最小化,(ii)并对作为与输入到所述鉴别器的所述第1混淆的训练数据相对应的至少一个第1混淆的训练数据分数的至少一个第2_1错误进行最大化,从而使所述混淆网络成为第1学习的混淆网络,所述学习装置学习所述鉴别器,(i)以对与输入到所述鉴别器的所述修改训练数据或所述混淆的修改训练数据相对应的至少一个第1修改训练数据分数或至少一个第1混淆的修改训练数据分数进行最大化,(ii)并对所述第1混淆的训练数据分数进行最小化,从而使所述鉴别器成为第1学习的鉴别器,
所述学习装置在将整数k从2增加到n的同时,(i)将所述训练数据输入到所述第k-1学习的混淆网络中,以使所述第k-1学习的混淆网络对所述训练数据进行混淆,从而生成第k混淆的训练数据,(ii)(ii-1)将所述第k混淆的训练数据输入到第k学习网络中,以使所述第k学习网络用所述第k学习网络中至少一个第k学习参数将网络运算应用于所述第k混淆的训练数据,从而输出关于所述第k混淆的训练数据的第1_k特征信息,(ii-2)将所述训练数据输入到所述第k学习网络中,以使所述第k学习网络用所述第k学习参数将网络运算应用于所述训练数据,从而输出关于所述训练数据的第2_k特征信息,(iii)学习所述第k-1学习的混淆网络,以对通过参考(iii-1)将所述第1_k特征信息和所述第2_k特征信息作为参考而获得的至少一个第(1_1)_k错误与(iii-2)将用所述第1_k特征信息生成的至少一个第k任务特定输出和与所述第k任务特定输出对应的至少一个第k真实数据作为参考而获得的至少一个第(1_2)_k错误中至少一部分来计算出的至少一个第1_k错误进行最小化,并对作为与输入到所述第k-1学习的鉴别器的所述第k混淆的训练数据相对应的至少一个第k混淆的训练数据分数的至少一个第2_k错误进行最大化,从而使所述k-1学习的混淆网络成为第k学习的混淆网络,(iv)学习所述第k-1学习的鉴别器,以对与输入到所述第k-1学习的鉴别器的所述修改训练数据或所述混淆的修改训练数据相对应的至少一个第k修改训练数据分数或至少一个第k混淆的修改训练数据分数进行最大化,并对所述第k混淆的训练数据分数进行最小化,从而使所述k-1学习的鉴别器成为第k学习的鉴别器。
7.根据权利要求4所述的方法,其中,
分别与输入到所述鉴别器的所述修改训练数据或所述混淆的修改训练数据相对应的所述修改训练数据分数或所述混淆的修改训练数据分数的最大值为1,作为分别用于鉴别所述修改训练数据或所述混淆的修改训练数据为真的值,并与输入到所述鉴别器的所述混淆的训练数据相对应的所述混淆的训练数据分数的最小值为0,作为用于鉴别所述混淆的训练数据为假的值。
8.根据权利要求l所述的方法,其中,
在所述步骤(c)中,
所述学习装置通过参考(i)所述第1特征信息和所述第2特征信息之间的差异与(ii)所述任务特定输出和所述真实数据之间的至少一个差异中的至少一部分来获取所述第1错误,并通过参考所述训练数据和所述混淆的训练数据之间的至少一个差异来获取第2错误。
9.根据权利要求8所述的方法,其中,
所述学习装置通过参考所述第1特征信息和所述第2特征信息之间的范数或余弦相似度来获取所述第1错误。
10.根据权利要求l所述的方法,其中,
在所述步骤(c)中,
所述学习装置通过参考所述混淆的训练数据的熵值和干扰程度中至少一部分来测量至少一种质量,并通过参考测量的所述质量来获取所述第1错误。
11.一种学习用于隐藏原始数据以保护个人信息的混淆网络的测试方法,所述方法包括:
(a)测试装置在学习装置已经执行以下过程的条件下执行获取测试数据的过程:(i)获取训练数据并将其输入到混淆网络中,以使所述混淆网络对所述训练数据进行混淆,从而生成混淆的训练数据;(ii)将所述混淆的训练数据输入到具有至少一个学习参数的所述学习网络中,以使所述学习网络(ii-1)用所述学习参数将网络运算应用于所述混淆的训练数据,(ii-2)从而生成与所述混淆的训练数据相对应的第1特征信息;(iii)将所述训练数据输入到所述学习网络中,以使所述学习网络(iii-1)用所述学习参数将网络运算应用于所述训练数据,(iii-2)从而生成与所述训练数据相对应的第2特征信息;以及(iv)学习所述混淆网络,(iv-1)以对通过参考(iv-1a)将所述第1特征信息和所述第2特征信息作为参考而获得的至少一个第1_1错误与(iv-1b)将用所述第1特征信息生成的至少一个任务特定输出和与所述任务特定输出对应的至少一个真实数据作为参考而获得的至少一个第1_2错误中的至少一部分来计算出的至少一个第1错误进行最小化,(iv-2)对通过参考所述训练数据和所述混淆的训练数据来计算出的至少一个第2错误进行最大化;以及
(b)所述测试装置将所述测试数据输入到所述混淆网络中,以使所述混淆网络使用所述混淆网络的所述学习参数来混淆所述测试数据,从而将混淆的测试数据输出为隐藏的测试数据。
12.根据权利要求l1所述的方法,其中,
在所述步骤(a)中,
所述学习网络包括具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,当所述n为1或更大的整数时,
所述学习装置(i)将所述混淆的训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(i-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述混淆的训练数据,(i-2)从而输出关于所述混淆的训练数据的每个第1_1特征信息至第1_n特征信息;(ii)并将所述训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(ii-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述训练数据,(ii-2)从而输出关于所述训练数据的每个第2_1特征信息至第2_n特征信息;(iii)学习所述混淆网络,(iii-1)以对通过参考(iii-1a)将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的第(1_1)_1错误至将所述第1_n特征信息和所述第2_n特征信息作为参考而获得的第(1_1)_n错误的平均值的所述第1_1错误与(iii-1b)将用所述第1_1特征信息生成的至少一个第1任务特定输出和与所述第1任务特定输出对应的至少一个第1真实数据作为参考而获得的第(1_2)_1错误至将用所述第1_n特征信息生成的至少一个第n任务特定输出和与所述第n任务特定输出对应的至少一个第n真实数据作为参考而获得的第(1_2)_n错误的平均值的所述第1_2错误中至少一部分来计算出的所述第1错误进行最小化,(iii-2)并对通过参考所述训练数据和所述混淆的训练数据来计算出的所述第2错误进行最大化。
13.根据权利要求l1所述的方法,其中,
在所述步骤(a)中,
所述学习装置(i)获得与输入到鉴别器的所述混淆的训练数据相对应的至少一个混淆的训练数据分数作为所述第2错误,其中所述鉴别器鉴别所输入数据的真实性,(ii)在学习所述混淆网络以最小化所述第1错误并最大化所述第2错误的同时,(iii)学习所述鉴别器,以对与输入到所述鉴别器的修改训练数据或混淆的修改训练数据相对应的至少一个修改训练数据分数或至少一个混淆的修改训练数据分数进行最大化,并对所述混淆的训练数据分数进行最小化,其中所述修改训练数据或所述混淆的修改训练数据为分别通过修改所述训练数据或所述混淆的训练数据而生成的数据。
14.根据权利要求l3所述的方法,其中,
在所述步骤(a)中,
所述学习网络包括具有至少一个第1学习参数至至少一个第n学习参数的第1学习网络至第n学习网络,其中,当所述n为1或更大的整数时,
所述学习装置(i)将所述混淆的训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(i-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述混淆的训练数据,(i-2)从而输出关于所述混淆的训练数据的每个第1_1特征信息至第1_n特征信息;(ii)并将所述训练数据输入到每个所述第1学习网络至所述第n学习网络中,以使每个所述第1学习网络至所述第n学习网络(ii-1)用每个所述第1学习网络至所述第n学习网络的所述第1学习参数至所述第n学习参数将与每个网络相对应的网络运算应用于所述训练数据,(ii-2)从而输出关于所述训练数据的每个第2_1特征信息至第2_n特征信息;(iii)学习所述混淆网络,(iii-1)以对通过参考(iii-1a)将所述第1_1特征信息和所述第2_1特征信息作为参考而获得的第(1_1)_1错误至将所述第1_n特征信息和所述第2_n特征信息作为参考而获得的第(1_1)_n错误的平均值的所述第1_1错误与(iii-1b)将用所述第1_1特征信息生成的至少一个第1任务特定输出和与所述第1任务特定输出对应的至少一个第1真实数据作为参考而获得的第(1_2)_1错误至将用所述第1_n特征信息生成的至少一个第n任务特定输出和与所述第n任务特定输出对应的至少一个第n真实数据作为参考而获得的第(1_2)_n错误的平均值的所述第1_2错误中至少一部分来计算出的所述第1错误进行最小化,(iii-2)对作为与输入到所述鉴别器的所述混淆的训练数据相对应的所述修改训练数据分数的所述第2错误进行最大化;以及(iv)学习所述鉴别器,以对分别与输入到所述鉴别器的所述修改训练数据或所述混淆的修改训练数据相对应的所述修改训练数据分数或所述混淆的修改训练数据分数进行最大化,并对所述修改训练数据分数进行最小化。
15.一...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。