当前位置: 首页 > 专利查询>东南大学专利>正文

一种隐私保护数据共享发布方法技术

技术编号:6147760 阅读:311 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种隐私保护数据共享发布方法,包括如下步骤:用户通过服务器接口提交数据集,服务器判断数据集维数,若为奇数,则增加一个属性,该维数据属性值置零,将属性随机两两分组;分析数据集中数据点间的距离关系,确定阿基米德螺线旋转参数,借助阿基米德螺线的几何性质,对原始数据中属性值对进行阿基米德螺线旋转变换,生成变换后数据集。本发明专利技术通过维持原始数据集任意三个数据记录间距离关系稳定实现隐藏前后数据集聚类效果相同(或相似),实现有效兼顾聚类可用性和数据隐私安全性的隐私保护数据共享发布。

【技术实现步骤摘要】

本专利技术涉及一种数据处理方法,特别是。
技术介绍
近年来聚类挖掘已在一些深层次数据应用中取得较大进展,但随着人们对数据隐 私的日益关注,对数据进行共享挖掘也带来了隐私保护方面的问题。例如,通过对电子病历 进行挖掘可以得到病症的聚类,但医疗机构若直接将原始数据提供给挖掘者,会导致病例 数据暴露,泄露患者隐私。保险公司的理赔信息、银行卡交易等数据中隐含的聚类模式,对 政府和企业决策具有重要意义,同时又都可能涉及个人隐私。隐私保护数据发布需要在保护数据隐私和维持数据可用性间寻求一种折中,目前 数据隐藏技术的主要思想是通过对原始个体数据取值的修改实现对微数据隐私安全的保 护,这种修改将以较大的概率造成数据个体差异的改变;而聚类挖掘恰恰通过分析数据个 体的相似和相异性,按照属于同一聚簇的数据对象具有较低的相异性,属于不同聚簇的数 据对象间具有较高相异性的思想将数据划分成簇,聚类过程严重依赖于个体数据间的相异 性。某种程度上,聚类与隐藏在原理上存在依赖数据个体差异与弱化数据个体差异的冲突, 导致面向聚类的数据隐藏有别于面向其它数据应用的隐藏。面向聚类的数据隐藏发布更是 由于以下几方面原因变本文档来自技高网...

【技术保护点】
1.一种隐私保护数据共享发布方法,其特征在于,包括如下步骤:(1)用户向服务器提交包含n条记录的原始数据集D,D包含m个属性列I1,I2,…,Im;(2)若所述步骤(1)中的m为奇数,则转到步骤(3),若m为偶数,则转到步骤(4);(3)为D生成第m+1个属性列Im+1,D中n条记录在属性列Im+1上的取值均为0;(4)将D中属性列随机两两分组,得到m/2或(m+1)/2个属性列对(Ii,Ij),1≤i≠j≤m+1;(5)对D中任意三个满足AB≥AC≥BC的不同的数据点A、B、C,生成基于阿基米德螺线旋转数据变换后保持所述三个数据点距离关系保持稳定的旋转参数取值范围βk,k∈[1,2,3,.....

【技术特征摘要】

【专利技术属性】
技术研发人员:倪巍伟陆介平崇志宏黄茂峰
申请(专利权)人:东南大学
类型:发明
国别省市:84

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1