【技术实现步骤摘要】
本专利技术涉及一种数据处理方法,特别是。
技术介绍
近年来聚类挖掘已在一些深层次数据应用中取得较大进展,但随着人们对数据隐 私的日益关注,对数据进行共享挖掘也带来了隐私保护方面的问题。例如,通过对电子病历 进行挖掘可以得到病症的聚类,但医疗机构若直接将原始数据提供给挖掘者,会导致病例 数据暴露,泄露患者隐私。保险公司的理赔信息、银行卡交易等数据中隐含的聚类模式,对 政府和企业决策具有重要意义,同时又都可能涉及个人隐私。隐私保护数据发布需要在保护数据隐私和维持数据可用性间寻求一种折中,目前 数据隐藏技术的主要思想是通过对原始个体数据取值的修改实现对微数据隐私安全的保 护,这种修改将以较大的概率造成数据个体差异的改变;而聚类挖掘恰恰通过分析数据个 体的相似和相异性,按照属于同一聚簇的数据对象具有较低的相异性,属于不同聚簇的数 据对象间具有较高相异性的思想将数据划分成簇,聚类过程严重依赖于个体数据间的相异 性。某种程度上,聚类与隐藏在原理上存在依赖数据个体差异与弱化数据个体差异的冲突, 导致面向聚类的数据隐藏有别于面向其它数据应用的隐藏。面向聚类的数据隐藏发布更是 ...
【技术保护点】
1.一种隐私保护数据共享发布方法,其特征在于,包括如下步骤:(1)用户向服务器提交包含n条记录的原始数据集D,D包含m个属性列I1,I2,…,Im;(2)若所述步骤(1)中的m为奇数,则转到步骤(3),若m为偶数,则转到步骤(4);(3)为D生成第m+1个属性列Im+1,D中n条记录在属性列Im+1上的取值均为0;(4)将D中属性列随机两两分组,得到m/2或(m+1)/2个属性列对(Ii,Ij),1≤i≠j≤m+1;(5)对D中任意三个满足AB≥AC≥BC的不同的数据点A、B、C,生成基于阿基米德螺线旋转数据变换后保持所述三个数据点距离关系保持稳定的旋转参数取值范围βk,k ...
【技术特征摘要】
【专利技术属性】
技术研发人员:倪巍伟,陆介平,崇志宏,黄茂峰,
申请(专利权)人:东南大学,
类型:发明
国别省市:84
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。