一种多用户匿名提交数据方法技术

技术编号:35699767 阅读:16 留言:0更新日期:2022-11-23 14:52
本发明专利技术公开了一种多用户匿名提交数据方法。该方法包括:对预设的多用户匿名历史数据集进行数据挖掘处理,得到用户隐私与特征基因集;根据所述用户隐私与特征基因集,将所述多用户匿名提交历史数据与所述用户隐私与特征基因集相关联,根据所述关联结果,对所述用户隐私与特征基因集进行处理,得到数据特征模型集;根据所述数据特征模型集,判断拟提交数据类型;根据拟提交数据类型,将所述拟提交数据进行提交。可见,本发明专利技术能够实现在数据提交前首先通过判断数据隐私数据的可挖掘性,确定数据上传方法,提高了数据发布效率和可用性,降低了用户隐私可挖掘性。低了用户隐私可挖掘性。低了用户隐私可挖掘性。

【技术实现步骤摘要】
一种多用户匿名提交数据方法


[0001]本专利技术涉及数据安全领域,尤其涉及一种多用户匿名提交数据方法领域。

技术介绍

[0002]当前,平台多用户匿名提交数据的关键是隐私数据保护。而隐私数据保护包括直接隐私数据保护和间接隐私数据保护。直接隐私数据指的是直接反映用户隐私与特征的数据。间接隐私数据指的是通过数据本身的知识性、背景场景、价值性、特异性、使用性等可以间接推测出用户隐私与特征的数据,或通过数据之间的关联性、协同性、价值性、特异性、使用性、导向性等可以间接推测出用户隐私与特征的数据集合。目前,对隐私数据保护的方法很多,涉及数据上传/采集、数据挖掘、数据存储、数据处理、数据分析和数据使用的各个阶段。
[0003]由于数据上传后大数据平台后,大数据平台对平台用户和数据关系的充分掌握,可能会给平台用户带来难以估量的风险,使平台用户对核心数据、涉密数据、隐私数据的上传和共享顾虑重重。在数据上传/采集阶段,如何实现多用户匿名提交数据,且不会被数据平台、数据买方、数据加工者等第三方根据隐私数据推测出来用户信息,成为数据大规模共享的关键核心问题。
[0004]当前,为保证数据隐私性,数据提交方法普遍采用数据匿名发布方法。一方面,数据匿名保护效果与算法的复杂度正相关,导致有效的数据匿名发布方法的效率低下,难以适应数据平台的需求。另一方面,数据匿名发布方法难以平衡数据可用性和用户隐私可挖掘性,即为了保障数据的可用性,却可能导致利用隐私数据挖掘方法分析出用户隐私与特征,使用户存在信息泄露风险。

技术实现思路

[0005]鉴于上述数据提交方法存在的问题,本专利技术的目的在于提供一种多用户匿名提交数据方法。通过对历史数据的挖掘,得到用户隐私与特征基因,并构建数据特征模型,利用所述的用户隐私与特征基因和数据特征模型,对拟提交数据进行挖掘分析,对不同数据类型的拟提交数据采用不同的提交方法,提高了数据发布效率和可用性,降低了用户隐私可挖掘性。
[0006]为了解决上述技术问题,本专利技术实施例公开了一种多用户匿名提交数据方法,所述方法包括:
[0007]S1、利用数据挖掘技术,对预设的多用户匿名历史数据集进行处理,得到用户隐私与特征信息集;
[0008]S2、对所述用户隐私与特征信息集进行信息提取、编码,得到用户隐私与特征基因集;
[0009]S3、根据所述用户隐私与特征基因集,将所述多用户匿名提交历史数据与所述用户隐私与特征基因集相关联,得到关联结果集;
[0010]S4、根据所述关联结果集,对所述用户隐私与特征基因集进行处理,得到数据特征模型集;
[0011]S5、根据所述数据特征模型集,判断拟提交数据的数据类型,得到拟提交数据类型信息;所述数据类型信息包括直接隐私数据、间接隐私数据、间接隐私数据集合、非隐私数据集合;
[0012]S6、所述拟提交数据类型信息是非隐私数据集合时,将所述拟提交数据直接匿名提交;否则,将所述拟提交数据采用多用户匿名分区方法提交数据方法提交。
[0013]作为一种可选的实施方式,在本专利技术实施例中,所述利用数据挖掘技术,对预设的多用户匿名历史数据集进行处理,得到用户隐私与特征信息集,包括:
[0014]S11、采用数据挖掘技术,对预设的多用户匿名提交的历史数据集合进行直接隐私数据挖掘,得到直接隐私数据集和潜在间接隐私数据集;所述潜在间接隐私数据集为所述预设的多用户匿名提交的历史数据集合中除所述直接隐私数据集之外的数据集合;所述数据挖掘技术包括但不限于:k匿名算法、扰动算法、关联规则隐藏算法;
[0015]S12、对所述直接隐私数据集中直接隐私数据进行挖掘,得到第一用户隐私与特征数据集;
[0016]S13、识别直接隐私数据与所述第一用户隐私与特征数据集中用户隐私与特征的对应关系,得到直接隐私数据与用户隐私与特征的对应关系集;
[0017]S14、采用数据挖掘与分析技术,对所述潜在间接隐私数据特性集中潜在间接隐私数据的知识性、背景场景、价值性、特异性、使用性进行挖掘,得到第二用户隐私与特征数据集;所述数据挖掘与分析技术包括但不限于:统计检验法、分支定界法、遗传算法、主成分分析法、离散K

L变换法;
[0018]S15、识别潜在间接隐私数据与所述第二用户隐私与特征数据集中用户隐私与特征的对应关系,得到潜在间接隐私数据与用户隐私与特征的对应关系集;
[0019]S16、采用统计检验法、分支定界法、遗传算法、主成分分析法、离散K

L变换法等数据挖掘与分析方法,对所述潜在间接隐私数据集中潜在间接隐私数据之间的关联性、协同性、价值性、特异性、使用性、导向性进行挖掘与提取,得到第三用户隐私与特征数据集;
[0020]S17、识别潜在间接隐私数据集中的任意子集与所述第三用户隐私与特征数据集中用户隐私与特征的对应关系,得到潜在间接隐私数据集中任意子集与用户隐私与特征的对应关系集;
[0021]S18、将所述第一用户隐私与特征数据集、所述第二用户隐私与特征数据集、所述第三用户隐私与特征数据集进行合并处理,得到用户隐私与特征数据集。
[0022]作为一种可选的实施方式,在本专利技术实施例中,所述对所述用户隐私与特征信息集进行信息提取、编码,得到用户隐私与特征基因集,包括:
[0023]S21、将所述用户隐私与特征数据集进行查重、去冗余,得到第四用户隐私与特征数据集;
[0024]S22、将所述第四用户隐私与特征数据集划分为最小用户隐私与特征单元,得到用户隐私与特征基因集;
[0025]所述用户隐私与特征基因表示为{最小用户隐私与特征单元,相关类型,与用户隐私与特征相关的直接隐私数据编号,与用户隐私与特征相关的间接隐私数据编号,与用户
隐私与特征相关的间接隐私数据集合编号,最小用户隐私与特征单元排序编码};所述相关类型表征与直接隐私数据或间接隐私数据。
[0026]作为一种可选的实施方式,在本专利技术实施例中,所述根据所述用户隐私与特征基因集,将所述多用户匿名提交历史数据与所述用户隐私与特征基因集相关联,得到关联结果集,包括:
[0027]利用所述直接隐私数据与用户隐私与特征的对应关系集、所述潜在间接隐私数据与用户隐私与特征的对应关系集、所述潜在间接隐私数据集中任意子集与用户隐私与特征的对应关系集,得到关联结果集;
[0028]所述关联结果集表示为{历史数据,用户隐私与特征基因};
[0029]所述历史数据表征直接隐私数据,或,间接隐私数据,或,间接隐私数据集合;所述用户隐私与特征基因表征所述历史数据对应的用户隐私与特征基因。
[0030]作为一种可选的实施方式,在本专利技术实施例中,所述根据所述关联结果集,对所述用户隐私与特征基因集进行处理,得到数据特征模型集,包括:
[0031]S41、根据所述关联结果集,对所述多用户中任一用户构建数据特征模型,包括:
[0032]S411、从所述用户隐私与特征本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多用户匿名提交数据方法,其特征在于,包括:S1、利用数据挖掘技术,对预设的多用户匿名历史数据集进行处理,得到用户隐私与特征信息集;S2、对所述用户隐私与特征信息集进行信息提取、编码,得到用户隐私与特征基因集;S3、根据所述用户隐私与特征基因集,将所述多用户匿名提交历史数据与所述用户隐私与特征基因集相关联,得到关联结果集;S4、根据所述关联结果集,对所述用户隐私与特征基因集进行处理,得到数据特征模型集;S5、根据所述数据特征模型集,判断拟提交数据的数据类型,得到拟提交数据类型信息;所述数据类型信息包括直接隐私数据、间接隐私数据、间接隐私数据集合、非隐私数据集合;S6、所述拟提交数据类型信息是非隐私数据集合时,将所述拟提交数据直接匿名提交;否则,将所述拟提交数据采用多用户匿名分区方法提交数据方法提交。2.根据权利要求1所述的多用户匿名提交数据方法,其特征在于,所述步骤S1包括:S11、采用数据挖掘技术,对预设的多用户匿名提交的历史数据集合进行直接隐私数据挖掘,得到直接隐私数据集和潜在间接隐私数据集;所述潜在间接隐私数据集为所述预设的多用户匿名提交的历史数据集合中除所述直接隐私数据集之外的数据集合;S12、对所述直接隐私数据集中直接隐私数据进行挖掘,得到第一用户隐私与特征数据集;S13、识别直接隐私数据与所述第一用户隐私与特征数据集中用户隐私与特征的对应关系,得到直接隐私数据与用户隐私与特征的对应关系集;S14、采用数据挖掘与分析技术,对所述潜在间接隐私数据特性集中潜在间接隐私数据的知识性、背景场景、价值性、特异性、使用性进行挖掘,得到第二用户隐私与特征数据集;S15、识别潜在间接隐私数据与所述第二用户隐私与特征数据集中用户隐私与特征的对应关系,得到潜在间接隐私数据与用户隐私与特征的对应关系集;S16、采用数据挖掘与分析方法,对所述潜在间接隐私数据集中潜在间接隐私数据之间的关联性、协同性、价值性、特异性、使用性、导向性进行挖掘与提取,得到第三用户隐私与特征数据集;S17、识别潜在间接隐私数据集中的任意子集与所述第三用户隐私与特征数据集中用户隐私与特征的对应关系,得到潜在间接隐私数据集中任意子集与用户隐私与特征的对应关系集;S18、将所述第一用户隐私与特征数据集、所述第二用户隐私与特征数据集、所述第三用户隐私与特征数据集进行合并处理,得到用户隐私与特征数据集。3.根据权利要求2所述的多用户匿名提交数据方法,其特征在于,所述步骤S2,包括:S21、将所述用户隐私与特征数据集进行查重、去冗余,得到第四用户隐私与特征数据集;S22、将所述第四用户隐私与特征数据集划分为最小用户隐私与特征单元,得到用户隐私与特征基因集;所述用户隐私与特征基因表示为{最小用户隐私与特征单元,相关类型,与用户隐私与
特征相关的直接隐私数据编号,与用户隐私与特征相关的间接隐私数据编号,与用户隐私与特征相关的间接隐私数据集合编号,最小用户隐私与特征单元排序编码};所述相关类型表征与直接隐私数据或间接隐私数据。4.根据权利要求3所述的多用户匿名提交数据方法,其特征在于,所述步骤S4,包括:S41、根据所述关联结果集,对所述多用户中任一用户构建数据特征模型,包括:S411、从所述用户隐私与特征基因集中,找出所述任一用户隐私与特征基因,以及所述任一用户隐私与特征基因对应的直接隐私数据、间接隐私数据或间接隐私数据集合,将所述任一用户隐私与特征基因和对应的直接隐私数据、间接隐私数据、间接隐私数据集合组合为数据族,得到所述任一用户的数据族;S412、将所述任一用户数据族中包括的所有直接隐私数据进行聚类分析,提取相同数据特征,得到第一数据特征模型;所述第一数据特征模型包括:{所述任一用户隐私与特征基因,直接隐私数据,聚类的直接隐私数据,聚类的直接隐私数据集合,聚类的直接隐私数据的相同数据特征};S413、将所述任一用户数据族中包括的所有间接隐私数据进行聚类分析,提取相同数据特征,得到第二数据特征模型;所述第二数据特征模型包括:{所述任一用户隐私与特征基因,间接隐私数据,聚类的间接隐私数据,聚类的间接隐私数据集合,聚类的间接隐私数据的相同数据特征};S414、提取所述任一用户数据族中各个间接隐私数据集合的内部关联特征,将提取的所有所述间接隐私数据集合的内部关联特征进行聚类分析,提取相同的内部关联特征,得到第三数据特征模型;所述第三数据特征模型包括:{所述任一用户隐私与特征基因,间接隐私数据集合,内部关联特征聚类的间接隐私数据集合,内部关联特征聚类的间接隐私数据集合的集合,间接隐私数据集合的内部关联特征的相同数据特征};S415、将所述任一用户的所述第一数据特征模型、所述第二数据特征模型、...

【专利技术属性】
技术研发人员:李志男孔博源张微王志轩马莺
申请(专利权)人:华教联创厦门科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1