【技术实现步骤摘要】
本专利技术涉及一种分类数据挖掘系统中数据隐私保护方法。
技术介绍
数据挖掘(Data Mining,DM)是从大量的、不完全的、有噪声、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。随着数据挖掘和知识发现技术的发展,数据挖掘和知识发现的研究已经涵盖数据库、人工智能和数理统计三大学科的内容。它把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识,提供决策和支持。由于数据挖掘的诸多优点,它在商业零售、医疗与保险、大数据分析等方面都有较好的应用前景,对数据挖掘技术的研究正成为学术界、商业界和工业界的热点之一。但是,数据挖掘在为人们提供有益知识的同时,也会直接或间接的泄露参与方的数据隐私,给当事人带来经济和其他方面的损失,甚至造成难以估量的影响,这成为数据挖掘不能逃避的问题。因此数据挖掘中的隐私安全问题具有重要意义。根据数据挖掘实现的不同场景,数据挖掘可分为集中式数据挖掘和分布式的数据挖掘。目前对于集中式的数据挖掘,由于它不涉及通信传输和多方参与,目前已经有了比较成熟的隐私保护方案。而在分布式环境中,挖掘环境和实现过程更为复杂,分布式环境中数据挖掘的隐私安全问题主要包括三个方面:(1)保护聚类挖掘参与方的数据隐私;(2)保护关联规则挖掘参与方的数据隐私;(3)保护分类挖掘中的参与方的数据隐私。目前对前两个方面的研究已有不少成果,然而对分类挖掘的隐私保护研究还少有人涉及, ...
【技术保护点】
一种分类数据挖掘系统中数据隐私保护方法,其中,系统中处理数据的各个属性按分布式垂直划分的方式分配给各个参与方,其特征在于,数据隐私保护方法包括如下步骤:步骤001.首先,各参与方分别将其隐私数据以密文形式,通过随机排序方式分布在其对应的随机数据中;然后,各参与方根据各自对应的随机数据进行合作计算,分别获得处理数据中各个属性的信息熵;步骤002.通过针对计算过程中计算结果采用加密传输的方式,各参与方根据处理数据中各个属性的信息熵进行合作计算,分别获得处理数据中各个属性的信息增益;步骤003.针对处理数据中各个属性的信息增益进行比较,获得最大信息增益所对应的属性,将该属性作为最佳分裂属性,以最佳分裂属性为节点进行分裂;步骤004.判断是否满足终止分裂条件,是则结束,否则返回步骤001。
【技术特征摘要】
1.一种分类数据挖掘系统中数据隐私保护方法,其中,系统中处理数据的各个属性按分布
式垂直划分的方式分配给各个参与方,其特征在于,数据隐私保护方法包括如下步骤:
步骤001.首先,各参与方分别将其隐私数据以密文形式,通过随机排序方式分布在其对
应的随机数据中;然后,各参与方根据各自对应的随机数据进行合作计算,分别获得处理
数据中各个属性的信息熵;
步骤002.通过针对计算过程中计算结果采用加密传输的方式,各参与方根据处理数据中
各个属性的信息熵进行合作计算,分别获得处理数据中各个属性的信息...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。