图数据发布的随机化隐私保护方法技术

技术编号：15250789 阅读：200 留言：0更新日期：2017-05-02 13:55

本发明专利技术公开一种图数据发布的随机化隐私保护方法，通过随机化扰动的方法对图数据进行处理，经过本发明专利技术处理后的数据能够共享发布给不特定第三方，而不会侵犯数据所含用户的隐私信息。同时，经过本发明专利技术处理后的图数据还具有较好的概率分布特性，能够根据隐私保护力度要求灵活的调整相关参数。

Random privacy protection method for graph data release

The invention discloses a release of the graph data privacy protection method of randomization, map data processing through the method of randomized perturbation, after treated by the invention can share the data release is not specific to the third party, but does not infringe on the privacy of users information contained in data. At the same time, the data processed by the invention has better probability distribution characteristics, and can flexibly adjust the relevant parameters according to the requirements of privacy protection.

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据发布
，具体涉及一种图数据发布的随机化隐私保护方法。
技术介绍
图数据可以用来描述物种之间的捕食关系，词与词之间的语义联系，计算机之间的网络联接，科研文章之间的引用关系，以及交通流量关系，甚至人类情感关系。当图数据中的实体结点涉及到人时，若直接发布数据或不当的共享给第三方，可能会产生隐私泄露问题。如攻击者如果知道被攻击对象有两个朋友，而发布数据中具有两个朋友的结点只有一个，则能够在发布的数据中重定位目标结点。因此需要在数据发布前对数据进行处理，以保护数据中用户的隐私不被泄露。
技术实现思路
本专利技术所要解决的技术问题是现有数据发布存在隐私泄露的问题，提供一种图数据发布的随机化隐私保护方法。为解决上述问题，本专利技术是通过以下技术方案实现的：图数据发布的随机化隐私保护方法，包括如下步骤：步骤1、设定扰动参数p，其中0<p<1；步骤2、计算图数据中不存的边添加到图数据中的概率q，式中，|E|为图数据中边的数目；N为完全图包含的边的数目，N＝n*(n-1)/2，n为图数据中结点的个数；p为扰动参数；步骤3、获得原始的图数据的邻接矩阵，并生成邻接矩阵的上三角矩阵；步骤4、对于步骤2所得的上三角矩阵中的每条存在的边进行成功概率为p的伯努利实验，得到基于存在边扰动的上三角矩阵；步骤5、对于步骤2所得到的上三角矩阵中的每条不存在的边进行成功概率为q的伯努利实验，得到基于不存在边扰动的上三角矩阵；步骤6、将步骤4得到的基于存在边扰动的上三角矩阵和步骤5得到的基于不存在边扰动的上三角矩阵进行叠加融合，得到最终扰动的上三角矩阵；步骤7、根据...

【技术保护点】
图数据发布的随机化隐私保护方法，其特征是，包括如下步骤：步骤1、设定扰动参数p，其中0<p<1；步骤2、计算图数据中不存的边添加到图数据中的概率q，q=|E|×(1-p)N-|E|;]]>式中，|E|为图数据中边的数目；N为完全图包含的边的数目，N＝n*(n‑1)/2，n为图数据中结点的个数；p为扰动参数；步骤3、获得原始的图数据的邻接矩阵，并生成邻接矩阵的上三角矩阵；步骤4、对于步骤2所得的上三角矩阵中的每条存在的边进行成功概率为p的伯努利实验，得到基于存在边扰动的上三角矩阵；步骤5、对于步骤2所得到的上三角矩阵中的每条不存在的边进行成功概率为q的伯努利实验，得到基于不存在边扰动的上三角矩阵；步骤6、将步骤4得到的基于存在边扰动的上三角矩阵和步骤5得到的基于不存在边扰动的上三角矩阵进行叠加融合，得到最终扰动的上三角矩阵；步骤7、根据步骤6得到的最终扰动的上三角矩阵生成新的邻接矩阵，并由此获得匿名后的图数据。

【技术特征摘要】
1.图数据发布的随机化隐私保护方法，其特征是，包括如下步骤：步骤1、设定扰动参数p，其中0<p<1；步骤2、计算图数据中不存的边添加到图数据中的概率q，q=|E|×(1-p)N-|E|;]]>式中，|E|为图数据中边的数目；N为完全图包含的边的数目，N＝n*(n-1)/2，n为图数据中结点的个数；p为扰动参数；步骤3、获得原始的图数据的邻接矩阵，并生成邻接矩阵的上三角矩阵；步骤4、对于步骤2所得的上三角矩阵中的每条存在的边进行成功概率为p的伯努利实验，得到基于存在边扰动的上三角矩阵；步骤5、对于步骤2所得到的上三角矩阵中的每条不存在的边进行成功概率为q的伯努利实验，得到基于不存在边扰动的上三角矩阵；步骤6、将步骤4得到的基于存在边扰动的上三角矩阵和步骤5得到的基于不存在边扰动的上三角矩阵进行叠加融合，得到最终扰动的上三角矩阵；步骤7、根据步骤6得到的最终扰动的上三角矩阵生成新的邻接矩阵，并由此获得匿名后的图数据。2.根据权利要求1所述的图数据发布的随机化隐私保护方法，其特征是，包括如下步骤：步骤1中，扰动参数p直接设定。3.根据权利要求1所述的图数据发布的随机化隐私保护方法，其特征是，步骤1中，扰动参数p通过以下步骤自适应获得：步骤1.1、设定隐私保护力度r和扰动...

【专利技术属性】
技术研发人员：刘鹏，李先贤，王利娥，
申请(专利权)人：广西师范大学，
类型：发明
国别省市：广西;45

全部详细技术资料下载我是这个专利的主人