【技术实现步骤摘要】
一种多用户匿名提交数据方法
[0001]本专利技术涉及数据安全领域,尤其涉及一种多用户匿名提交数据方法领域。
技术介绍
[0002]当前,平台多用户匿名提交数据的关键是隐私数据保护。而隐私数据保护包括直接隐私数据保护和间接隐私数据保护。直接隐私数据指的是直接反映用户隐私与特征的数据。间接隐私数据指的是通过数据本身的知识性、背景场景、价值性、特异性、使用性等可以间接推测出用户隐私与特征的数据,或通过数据之间的关联性、协同性、价值性、特异性、使用性、导向性等可以间接推测出用户隐私与特征的数据集合。目前,对隐私数据保护的方法很多,涉及数据上传/采集、数据挖掘、数据存储、数据处理、数据分析和数据使用的各个阶段。
[0003]由于数据上传后大数据平台后,大数据平台对平台用户和数据关系的充分掌握,可能会给平台用户带来难以估量的风险,使平台用户对核心数据、涉密数据、隐私数据的上传和共享顾虑重重。在数据上传/采集阶段,如何实现多用户匿名提交数据,且不会被数据平台、数据买方、数据加工者等第三方根据隐私数据推测出来用户信息,成为数据大规模共享的关键核心问题。
[0004]当前,为保证数据隐私性,数据提交方法普遍采用数据匿名发布方法。一方面,数据匿名保护效果与算法的复杂度正相关,导致有效的数据匿名发布方法的效率低下,难以适应数据平台的需求。另一方面,数据匿名发布方法难以平衡数据可用性和用户隐私可挖掘性,即为了保障数据的可用性,却可能导致利用隐私数据挖掘方法分析出用户隐私与特征,使用户存在信息泄露风险。
技术实现思路
...
【技术保护点】
【技术特征摘要】
1.一种多用户匿名提交数据方法,其特征在于,包括:S1、利用数据挖掘技术,对预设的多用户匿名历史数据集进行处理,得到用户隐私与特征信息集;S2、对所述用户隐私与特征信息集进行信息提取、编码,得到用户隐私与特征基因集;S3、根据所述用户隐私与特征基因集,将所述多用户匿名提交历史数据与所述用户隐私与特征基因集相关联,得到关联结果集;S4、根据所述关联结果集,对所述用户隐私与特征基因集进行处理,得到数据特征模型集;S5、根据所述数据特征模型集,判断拟提交数据的数据类型,得到拟提交数据类型信息;所述数据类型信息包括直接隐私数据、间接隐私数据、间接隐私数据集合、非隐私数据集合;S6、所述拟提交数据类型信息是非隐私数据集合时,将所述拟提交数据直接匿名提交;否则,将所述拟提交数据采用多用户匿名分区方法提交数据方法提交。2.根据权利要求1所述的多用户匿名提交数据方法,其特征在于,所述步骤S1包括:S11、采用数据挖掘技术,对预设的多用户匿名提交的历史数据集合进行直接隐私数据挖掘,得到直接隐私数据集和潜在间接隐私数据集;所述潜在间接隐私数据集为所述预设的多用户匿名提交的历史数据集合中除所述直接隐私数据集之外的数据集合;S12、对所述直接隐私数据集中直接隐私数据进行挖掘,得到第一用户隐私与特征数据集;S13、识别直接隐私数据与所述第一用户隐私与特征数据集中用户隐私与特征的对应关系,得到直接隐私数据与用户隐私与特征的对应关系集;S14、采用数据挖掘与分析技术,对所述潜在间接隐私数据特性集中潜在间接隐私数据的知识性、背景场景、价值性、特异性、使用性进行挖掘,得到第二用户隐私与特征数据集;S15、识别潜在间接隐私数据与所述第二用户隐私与特征数据集中用户隐私与特征的对应关系,得到潜在间接隐私数据与用户隐私与特征的对应关系集;S16、采用数据挖掘与分析方法,对所述潜在间接隐私数据集中潜在间接隐私数据之间的关联性、协同性、价值性、特异性、使用性、导向性进行挖掘与提取,得到第三用户隐私与特征数据集;S17、识别潜在间接隐私数据集中的任意子集与所述第三用户隐私与特征数据集中用户隐私与特征的对应关系,得到潜在间接隐私数据集中任意子集与用户隐私与特征的对应关系集;S18、将所述第一用户隐私与特征数据集、所述第二用户隐私与特征数据集、所述第三用户隐私与特征数据集进行合并处理,得到用户隐私与特征数据集。3.根据权利要求2所述的多用户匿名提交数据方法,其特征在于,所述步骤S2,包括:S21、将所述用户隐私与特征数据集进行查重、去冗余,得到第四用户隐私与特征数据集;S22、将所述第四用户隐私与特征数据集划分为最小用户隐私与特征单元,得到用户隐私与特征基因集;所述用户隐私与特征基因表示为{最小用户隐私与特征单元,相关类型,与用户隐私与
特征相关的直接隐私数据编号,与用户隐私与特征相关的间接隐私数据编号,与用户隐私与特征相关的间接隐私数据集合编号,最小用户隐私与特征单元排序编码};所述相关类型表征与直接隐私数据或间接隐私数据。4.根据权利要求3所述的多用户匿名提交数据方法,其特征在于,所述步骤S4,包括:S41、根据所述关联结果集,对所述多用户中任一用户构建数据特征模型,包括:S411、从所述用户隐私与特征基因集中,找出所述任一用户隐私与特征基因,以及所述任一用户隐私与特征基因对应的直接隐私数据、间接隐私数据或间接隐私数据集合,将所述任一用户隐私与特征基因和对应的直接隐私数据、间接隐私数据、间接隐私数据集合组合为数据族,得到所述任一用户的数据族;S412、将所述任一用户数据族中包括的所有直接隐私数据进行聚类分析,提取相同数据特征,得到第一数据特征模型;所述第一数据特征模型包括:{所述任一用户隐私与特征基因,直接隐私数据,聚类的直接隐私数据,聚类的直接隐私数据集合,聚类的直接隐私数据的相同数据特征};S413、将所述任一用户数据族中包括的所有间接隐私数据进行聚类分析,提取相同数据特征,得到第二数据特征模型;所述第二数据特征模型包括:{所述任一用户隐私与特征基因,间接隐私数据,聚类的间接隐私数据,聚类的间接隐私数据集合,聚类的间接隐私数据的相同数据特征};S414、提取所述任一用户数据族中各个间接隐私数据集合的内部关联特征,将提取的所有所述间接隐私数据集合的内部关联特征进行聚类分析,提取相同的内部关联特征,得到第三数据特征模型;所述第三数据特征模型包括:{所述任一用户隐私与特征基因,间接隐私数据集合,内部关联特征聚类的间接隐私数据集合,内部关联特征聚类的间接隐私数据集合的集合,间接隐私数据集合的内部关联特征的相同数据特征};S415、将所述任一用户的所述第一数据特征模型、所述第二数据特征模型、...
【专利技术属性】
技术研发人员:李志男,龚,孔博源,张微,王志轩,马莺,
申请(专利权)人:华教联创厦门科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。