数据保护处理方法、装置、设备及存储介质制造方法及图纸

技术编号:35756344 阅读:12 留言:0更新日期:2022-11-26 19:03
本申请公开了一种数据保护处理方法、装置、设备及存储介质,属于数据处理领域。该方法包括:获取多笔真实业务的业务数据,按照数据类别中的数据域从业务数据中提取数据项;基于每笔真实业务对应的数据项,得到初始数据域关联性结果参数,初始数据域关联性结果参数表征业务数据中数据域之间的关联关系;调用生成器和判别器基于初始数据域关联性结果参数进行数据处理迭代,直至数据处理迭代满足迭代截止条件,将配置有判别器在最近一次数据处理迭代中得到的数据域关联性结果参数的生成器生成的合成数据选取为用于业务分析的分析基础数据,数据域关联性结果参数表征输入判别器的数据中的数据域之间的关系。根据本申请实施例能够提高数据安全性。够提高数据安全性。够提高数据安全性。

【技术实现步骤摘要】
数据保护处理方法、装置、设备及存储介质


[0001]本申请属于数据处理领域,尤其涉及一种数据保护处理方法、装置、设备及存储介质。

技术介绍

[0002]随着数字化技术的不断发展,数据成为了重要的生产要素之一。越来越多的业务分析需要依靠大量数据作为分析基础数据进行建模或其他操作。但作为分析基础数据的数据可能会涉及数据隐私。为了保证数据的隐私安全,可通过加密对数据进行保护。但加密后的数据仍可追溯得到源数据,若加密后的数据发生泄露,仍然会危害数据隐私安全,降低数据安全性。

技术实现思路

[0003]本申请实施例提供一种数据保护处理方法、装置、设备及存储介质,能够提高数据安全性。
[0004]第一方面,本申请实施例提供一种数据保护处理方法,包括:获取多笔真实业务的业务数据,按照数据类别中的数据域从业务数据中提取数据项;基于每笔真实业务对应的数据项,得到初始数据域关联性结果参数,初始数据域关联性结果参数用于表征业务数据中数据域之间的关联关系;调用生成器和判别器基于初始数据域关联性结果参数进行数据处理迭代,直至数据处理迭代满足迭代截止条件,将配置有判别器在最近一次数据处理迭代中得到的数据域关联性结果参数的生成器生成的合成数据选取为用于业务分析的分析基础数据,数据域关联性结果参数用于表征输入判别器的数据中的数据域之间的关系。
[0005]第二方面,本申请实施例提供一种数据保护处理装置,包括:提取模块,用于获取多笔真实业务的业务数据,按照数据类别中的数据域从业务数据中提取数据项;计算模块,用于基于每笔真实业务对应的数据项,得到初始数据域关联性结果参数,初始数据域关联性结果参数用于表征业务数据中数据域之间的关联关系;训练调用模块,用于调用生成器和判别器基于初始数据域关联性结果参数进行数据处理迭代,直至数据处理迭代满足迭代截止条件,将配置有判别器在最近一次数据处理迭代中得到的数据域关联性结果参数的生成器生成的合成数据选取为用于业务分析的分析基础数据,数据域关联性结果参数用于表征输入判别器的数据中的数据域之间的关系。
[0006]第三方面,本申请实施例提供一种电子设备,包括:处理器以及存储有计算机程序指令的存储器;处理器执行计算机程序指令时实现第一方面的数据保护处理方法。
[0007]第四方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现第一方面的数据保护处理方法。
[0008]本申请实施例提供一种数据保护处理方法、装置、设备及存储介质,能够根据真实业务的业务数据中数据域的关联关系,利用生成器和判别器进行数据处理迭代,使得生成
器可根据判别器输出的表征数据的数据域的关联关系的数据域关联结果参数,生成合成数据,判别器根据该合成数据输出数据域关联结果参数以更新生成器,使生成器输出新的合成数据,重复该过程,直至数据处理迭代满足迭代处理条件,将生成器输出的合成数据选取为用于业务分析的分析基础数据。合成数据是生成器与判别器协作得到的数据,与真实业务的业务数据具有近似的外观、含义、统计特征等,但不是真实业务的业务数据,并不存在与合成数据对应的真实业务。合成数据作为业务分析的分析基础数据使用,既能满足业务分析的需求,又能够避免隐私数据的泄露,提高数据安全性。
附图说明
[0009]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0010]图1为本申请一实施例提供的数据保护处理方法的流程图;
[0011]图2为本申请另一实施例提供的数据保护处理方法的流程图;
[0012]图3为本申请实施例提供的数据保护处理流程的一示例的流程图;
[0013]图4为本申请一实施例提供的数据保护处理装置的结构示意图;
[0014]图5为本申请另一实施例提供的数据保护处理装置的结构示意图;
[0015]图6为本申请一实施例提供的电子设备的结构示意图。
具体实施方式
[0016]下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本申请,而不是限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
[0017]随着数字化技术的不断发展,数据成为了重要的生产要素之一。越来越多的业务分析需要依靠大量数据作为分析基础数据进行建模或其他操作。但作为分析基础数据的数据可能会涉及数据隐私。为了保证分析基础数据的隐私安全,可通过加密的方式对分析基础数据进行保护。但加密后的分析基础数据仍可追溯得到源数据,若加密后的分析基础数据发生泄露,仍然会危害数据隐私安全,降低数据安全性。
[0018]本申请提供一种数据保护处理方法、装置、设备及存储介质,能够根据真实业务的业务数据中数据域的关联关系,利用生成器和判别器进行数据处理迭代,通过生成器与判别器的相互更新,使生成器能够输出与真实业务的业务数据的外观、含义、统计特征等相近的但并不存在与其对应的真实业务的合成数据。根据该合成数据并不能追溯得到真实业务的业务数据,即,不能追溯得到真实数据,能够保护数据隐私安全,提高数据安全性。
[0019]下面对本申请提供的数据保护处理方法、装置、设备及存储介质分别进行说明。
[0020]本申请第一方面提供一种数据保护处理方法,可应用于为业务分析等操作提供分析基础数据的场景中,由数据保护处理装置、设备等执行该数据保护处理方法,在此并不限定数据保护处理装置、设备等的类型和数量。图1为本申请一实施例提供的数据保护处理方
法的流程图,如图1所示,该数据保护处理方法可包括步骤S101至步骤S103。
[0021]在步骤S101中,获取多笔真实业务的业务数据,按照数据类别中的数据域从业务数据中提取数据项。
[0022]真实业务的业务数据即为真实业务所产生的业务数据,可视为源数据。例如,真实业务为交易业务,交易业务的交易数据可包括用户年龄数据、交易金额数据、交易地区数据、交易币种数据、交易类别数据、是否使用优惠券的数据等,如果这些数据发生泄露,可能会对数据安全带来风险。
[0023]每笔真实业务的业务数据可包括多个数据项,数据项中的至少部分存在一定关联关系。可根据数据类别中的数据域,将数据项从业务数据中提取出来。业务数据可包括至少一个数据类别的数据。数据类别可为数据结构上的类别,例如,数据类别可包括以下一者或两者以上:布尔类型、数字类型、分类类型、连续字符类型。布尔类型的数据可包括只有两个值的数据,如值为true或false的数据,又如,值为0或1的数据。数字类型的数据包括值可用数字表示的数据,如用户年龄、本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据保护处理方法,其特征在于,包括:获取多笔真实业务的业务数据,按照数据类别中的数据域从所述业务数据中提取数据项;基于每笔真实业务对应的所述数据项,得到初始数据域关联性结果参数,所述初始数据域关联性结果参数用于表征所述业务数据中数据域之间的关联关系;调用生成器和判别器基于所述初始数据域关联性结果参数进行数据处理迭代,直至数据处理迭代满足迭代截止条件,将配置有所述判别器在最近一次数据处理迭代中得到的数据域关联性结果参数的所述生成器生成的合成数据选取为用于业务分析的分析基础数据,所述数据域关联性结果参数用于表征输入判别器的数据中的数据域之间的关系。2.根据权利要求1所述的方法,其特征在于,第一次数据处理迭代包括:调用所述生成器根据所述初始数据域关联性结果参数输出所述合成数据;调用判别器根据输入的第一混合数据,生成所述数据域关联性结果参数,所述第一混合数据包括所述合成数据与多笔真实业务的业务数据。3.根据权利要求1所述的方法,其特征在于,第i次数据处理迭代,包括:调用所述生成器根据第i

1次数据处理迭代中得到的所述数据域关联性结果参数输出所述合成数据;调用判别器根据第二混合数据生成所述数据域关联性结果参数,所述第二混合数据包括第i次数据处理迭代得到的所述合成数据与第i

1次数据处理迭代得到的所述合成数据,其中,i为大于1的整数。4.根据权利要求3所述的方法,其特征在于,所述调用判别器根据第二混合数据生成所述数据域关联性结果参数,包括:调用所述判别器按照所述数据类别中的数据域从所述第二混合数据中提取数据项;调用所述判别器随机组合提取出的数据项,得到多个组合数据;调用所述判别器基于所述初始数据域关联性结果参数,对所述组合数据评分;在所述组合数据的未满足评分截止条件的情况下,调用所述判别器再次随机组合提取出的数据项,增加所述组合数据,并对所述组合数据评分,直至所述组合数据满足所述评分截止条件,调用所述判别器基于所述组合数据,生成与所述组合数据中数据项对应的所述数据域关联性结果参数。5.根据权利要求1或4所述的方法,其特征在于,所述数据类别包括以下一者或两者以上:布尔类型、数字类型、分类类型、连续字符类型。6.根据权利要求5所述的方法,其特征在于,还包括:在所述数据类别包括所述连续字符类型的情况下,将所述业务数据或所述第二混合数据中属于所述连续字符类型的数据,按照数据子类别中的数据域拆分,得到数据项,所述数据子类别包括至少一个数据域,其中,所述数据子类别包括以下一者或两者以上:布尔类型、数字类型、分类类型。7.根据权利要求4所述的方法,其特征在于,在所述调用生成器和判别器基于所述初始数据域关联性结果参数进行数...

【专利技术属性】
技术研发人员:胡晨杨宏斌王栩邱晨力白冰商紫薇鲍鹏
申请(专利权)人:中国银联股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1