【技术实现步骤摘要】
数据处理方法、装置及计算机设备
本专利技术涉及计算机
,特别是涉及一种数据处理方法、装置及计算机设备。
技术介绍
随着科学技术的飞速发展,大数据时代逐步到来。各种数据挖掘技术都逐步应用于对数据库的数据挖掘,以揭示数据库中的隐含信息。然而,在使用数据挖掘技术挖掘数据库中隐含信息的同时,往往也会发掘出隐私数据或安全数据,从而导致安全性问题。为了提高数据挖掘的安全性,传统方法会基于是否完全隐藏敏感规则,通过删除数据库中的事务来隐藏所有敏感项集,以对数据库进行清洗,再基于清洗后的数据库进行数据挖掘处理。可以理解,删除事务必然会影响数据库的准确性和完整性,从而给数据库带来负面影响,而传统方法这种仅仅将完全隐藏敏感信息当成唯一指标对数据库进行数据删除的做法,会给数据库中带来很大的负面影响。
技术实现思路
基于此,有必要针对传统方法给数据库带来很大负面影响的问题,提供一种数据处理方法、装置、计算机设备及存储介质。一种数据处理方法,所述方法包括:从数据库中筛选出包括敏感项集的敏感事务;在所述敏感事务中取不同的组合,得到敏感事务组合;获取多目标函数;所述多目标函数中的各子目标函数 ...
【技术保护点】
1.一种数据处理方法,所述方法包括:从数据库中筛选出包括敏感项集的敏感事务;在所述敏感事务中取不同的组合,得到敏感事务组合;获取多目标函数;所述多目标函数中的各子目标函数,分别用于表示在删除数据库中的事务后所产生的各负面影响的负面影响程度;从所述敏感事务组合中,筛选出分别属于多目标函数的最优解集中各最优解的一个或多个敏感事务组合;属于最优解的敏感事务组合,用于在数据库中被删除后使所述多目标函数所表示的全局负面影响程度最小;当从所述最优解集中确定出最终最优解时,在数据库中删除属于所述最终最优解的敏感事务组合中的各敏感事务。
【技术特征摘要】
1.一种数据处理方法,所述方法包括:从数据库中筛选出包括敏感项集的敏感事务;在所述敏感事务中取不同的组合,得到敏感事务组合;获取多目标函数;所述多目标函数中的各子目标函数,分别用于表示在删除数据库中的事务后所产生的各负面影响的负面影响程度;从所述敏感事务组合中,筛选出分别属于多目标函数的最优解集中各最优解的一个或多个敏感事务组合;属于最优解的敏感事务组合,用于在数据库中被删除后使所述多目标函数所表示的全局负面影响程度最小;当从所述最优解集中确定出最终最优解时,在数据库中删除属于所述最终最优解的敏感事务组合中的各敏感事务。2.根据权利要求1所述的方法,其特征在于,所述在所述敏感事务中取不同的组合,得到敏感事务组合包括:获取所述敏感事务的事务标识;在所述事务标识中取不同的组合,作为染色体编码组合;将各染色体编码组合中的事务标识进行组合生成多个染色体,构成父种群;将所述父种群中不同染色体进行选择交叉变异处理,得到子种群;合并所述父种群和所述子种群,并根据与合并后的种群中同一染色体包括的各事务标识对应的敏感事务,得到敏感事务组合。3.根据权利要求2所述的方法,其特征在于,所述从所述敏感事务组合中,筛选出分别属于多目标函数的最优解集中各最优解的一个或多个敏感事务组合包括:针对合并后的种群中每个染色体,确定在数据库中删除所述染色体包括的事务标识所对应的敏感事务后,多目标函数的目标函数值;根据合并后的种群中各染色体所对应的目标函数值,对各染色体进行非支配排序处理;非支配排序的序值大小与目标函数值的大小正相关;按非支配排序的序值大小,从合并后的种群中选取属于非支配解的染色体;根据各选取的染色体包括的各事务标识所对应的敏感事务,得到分别属于多目标函数的最优解集中各最优解的敏感事务组合。4.根据权利要求3所述的方法,其特征在于,所述按非支配排序的序值大小,从合并后的种群中选取属于非支配解的染色体包括:按照非支配排序的序值由小到大的顺序,从合并后的种群中选取符合所述子种群的染色体数量的染色体;将选取的染色体作为下次迭代的父种群,并返回所述将所述父种群中不同染色体进行选择交叉变异处理,得到子种群的步骤进行迭代处理,直至满足迭代停止条件;从满足迭代停止条件时所获取的各染色体中,确定属于非支配解的染色体。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:确定合并后的种群中各染色体的拥挤距离;所述按照非支配排序的序值由小到大的顺序,从合并后的种群中选取符合所述子种群的染色体数量的染色体包括:针对不同序值的染色体按照非支配排序的序值由小到大的顺序、且针对同一序值的染色体按照拥挤距离由大到小的顺序,从合并后的种群中选取符合所述子种群的染色体数量的染色体。6.根据权利要求3所述的方法,其特征在于,所述根据合并后的种群中各染色体所对应的目标函数值,对各染色体进行非支配排序处理包括:确定合并后的种群中各染色体对应于各子目标函数的子目标函数值;针对每个子目标函数,将各染色体对应于所述子目标函数的各子目标函数值进行降序排序,得到每个染色体分别对应于各子目标函数的子排序序值;将同一染色体对应的各子排序序值进行累加,得到相应累加序值;按照各染色体的累加序值由小到大的顺序,对各染色体进行升序排序。7.根据权利要求3所述的方法,其特征在于,所述多目标函数,包括用于表示敏感项集未被隐藏个数的第一子目标函数、用于表示非敏感项集被误隐藏个数的第二子目标函数、用于表示产生的人工频繁项集个数的第三子目标函数以及用于表示数据库扭曲程度的第四子目标函数。8.根据权利要求7所述的方法,其特征在于,所述针对合并后的种群中每个染色体,确定在数据库中删...
【专利技术属性】
技术研发人员:林浚玮,张瑜钰,王巨宏,陈伟,刘婷婷,
申请(专利权)人:哈尔滨工业大学深圳,腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。