一种个人行为数据匿名化方法及系统技术方案

技术编号:11049326 阅读:284 留言:0更新日期:2015-02-18 14:33
本发明专利技术公开了一种个人行为数据匿名化方法及系统,其通过对用户行为进行建模,计算用户行为出现的先验概率,再根据用户已经公开的行为,对当前可能的行为进行划分和一般化表示,可以保证攻击者即使在已知用户行为习惯和本匿名方法的情况下,仍然不能对隐私信息出现概率的做出更高的推测,降低甚至避免了泄漏个人隐私的风险。

【技术实现步骤摘要】

本专利技术涉及计算机
,一种个人行为数据匿名化方法及系统
技术介绍
随着当今移动技术的飞速发展,移动设备和各类传感器的广泛应用,如手机、手环及在设备上安装的众多应用都会采集到人们生活中的各类数据。这些数据一方面使人们的生活更加便捷,另一方面也使得个人信息更多地被服务商收集,增大了隐私泄露的风险。当前隐私保护的问题逐渐被人们重视,也出现了许多对数据进行匿名化的方法。这些方法主要分为两种,一种在移动端,对传输到服务器的数据进行处理;另一种在服务器端,对收集到的所有数据进行处理。这些方法包括对数据增加噪声、加密、替换、删除属性或者与伪造数据结合等。目前,匿名化的方法会对破坏隐私的一方已知的信息做出限制,这样限制攻击者能力的匿名化方法并不能保证是完全可靠的,另外,有一些对数据的修改也会造成数据实用性降低。
技术实现思路
本专利技术的目的是提供一种个人行为数据匿名化方法及系统,通过对用户行为进行合理的合并和一般化,确保真实信息不会被泄露,也保证了数据的实用性。本专利技术的目的是通过以下技术方案实现的:一种个人行为数据匿名化方法,该方法包括:按照时间顺序对用户行为使用一阶马尔科夫链进行建模,获得各个用户行为c发生的先验概率Pr[Xt=c],Xt表示时刻t发生用户行为c的随机变量;根据已经发生的用户行为集合并结合一阶马尔科夫链模型计算当前时刻t可能发生的用户行为集合;对所述可能发生的用户行为集合进行划分,获得若干组划分后的集合;划分后的每一组集合中均包含多个子集,再基于下式对每一组集合中的子集进行判断:筛选出所有子集均可公开的集合;其中,s为用户设定的隐私集合S中需要保护的用户行为,δ为隐私保护的程度,其值越小保护程度越高,为包含已经发生的用户行为集合与当前子集的集合;当发生某一真实用户行为时,选择包含该真实用户行为的子集向外发送,实现个人行为数据匿名化。进一步的,所述对所述可能发生的用户行为集合进行划分,获得若干组划分后的集合,并基于下式进行筛选:获得所有子集均可公开的集合包括:枚举所述可能发生的用户行为集合中所有的子集,获得若干组划分后的集合;再根据隐私行为集合S判断每一子集是否可以公开;其中,满足下式Pr[Xt=s|o′→]-Pr[Xt=s]≤δ,]]>则表示该子集可以公开;从所述若干组划分后的集合中,筛选所有子集均可公开的集合;从所述所有子集均可公开的集合中选择实用性最大的集合;其中,一个子集的实用性为该子集的先验概率除以子集中用户行为的个数,一个集合的实用性为其子集的实用性之和。进一步的,集合中的每一子集中包含一个或多个用户行为,若包含多个用户行为,则所述多个用户行为至少存在一个相同或相似的属性。一种个人行为数据匿名化系统,该系统包括:建模模块,用于按照时间顺序对用户行为使用一阶马尔科夫链进行建模,获得各个用户行为c发生的先验概率Pr[Xt=c],Xt表示时刻t发生用户行为c的随机变量;用户行为集合获取模块,用于根据已经发生的用户行为集合并结合一阶马尔科夫链模型计算当前时刻t可能发生的用户行为集合;集合划分与筛选模块,用于对所述可能发生的用户行为集合进行划分,获得若干组划分后的集合;划分后的每一组集合中均包含多个子集,再基于下式对每一组集合中的子集进行判断:筛选出所有子集均可公开的集合;其中,s为用户设定的隐私集合S中需要保护的用户行为,δ为隐私保护的程度,其值越小保护程度越高,为包含已经发生的用户行为集合与当前子集的集合;匿名发送模块,用于当发生某一真实用户行为时,选择包含该真实用户行为的子集向外发送,实现个人行为数据匿名化。进一步的,所述集合划分与获取模块包括:集合划分模块,用于枚举所述可能发生的用户行为集合中所有的子集,获得若干组划分后的集合;判断模块,用于根据隐私行为集合S判断每一子集是否可以公开;其中,满足下式Pr[Xt=s|o′→]-Pr[Xt=s]≤δ,]]>则表示该子集可以公开;集合筛选模块,从所述若干组划分后的集合中,筛选所有子集均可公开的集合;集合选择模块,用于从所述所有子集均可公开的集合中选择实用性最大的集合;其中,一个子集的实用性为该子集的先验概率除以子集中用户行为的个数,一个集合的实用性为其子集的实用性之和。进一步的,集合中的每一子集中包含一个或多个用户行为,若包含多个用户行为,则所述多个用户行为至少存在一个相同或相似的属性。由上述本专利技术提供的技术方案可以看出,通过对用户行为进行建模,计算用户行为出现的先验概率,再根据用户已经公开的行为,对当前可能的行为进行划分和一般化表示,可以保证攻击者即使在已知用户行为习惯和本匿名方法的情况下,仍然不能对隐私信息出现概率做出更高的推测,降低甚至避免了泄漏个人隐私的风险。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。图1为本专利技术实施例一提供的一种个人行为数据匿名化方法的流程图;图2为本专利技术实施例一提供的一种使用一阶马尔科夫链对用户行为建模的示意图;图3为本专利技术实施例一提供的一种对行为集合划分的具体方法的流程图;图4为本专利技术实施例一提供的一种将行为按属性划分的示意图;图5为本专利技术实施例一提供的一种对真实数据集进行实验的结果示意图;图6为本专利技术实施例二提供的一种个人行为数据匿名化系统的示意图。具体实施方式下面结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术的保护范围。实施例一图1为本专利技术实施例一提供的一种个人行为数据匿名化方法的流程图。如图1所示,该方法主要包括如下步骤:步骤11、按照时间顺序对用户行为使用一阶马尔科夫链进行建模,获得各个用户行为c发生的先验概率Pr[Xt=c],Xt表示时刻t发生用户行为c的随机变量。步骤12、根据已经发生的用户行为集合并结合一阶马尔科夫链模型计算当前时刻t可能发生的用户行为集合。步骤13、对所述可能发本文档来自技高网...
一种个人行为数据匿名化方法及系统

【技术保护点】
一种个人行为数据匿名化方法,其特征在于,该方法包括:按照时间顺序对用户行为使用一阶马尔科夫链进行建模,获得各个用户行为c发生的先验概率Pr[Xt=c],Xt表示时刻t发生用户行为c的随机变量;根据已经发生的用户行为集合并结合一阶马尔科夫链模型计算当前时刻t可能发生的用户行为集合;对所述可能发生的用户行为集合进行划分,获得若干组划分后的集合;划分后的每一组集合中均包含多个子集,再基于下式对每一组集合中的子集进行判断:筛选出所有子集均可公开的集合;其中,s为用户设定的隐私集合S中需要保护的用户行为,δ为隐私保护的程度,其值越小保护程度越高,为包含已经发生的用户行为集合与当前子集的集合;当发生某一真实用户行为时,选择包含该真实用户行为的子集向外发送,实现个人行为数据匿名化。

【技术特征摘要】
1.一种个人行为数据匿名化方法,其特征在于,该方法包括:
按照时间顺序对用户行为使用一阶马尔科夫链进行建模,获得各个用户行为c发生的
先验概率Pr[Xt=c],Xt表示时刻t发生用户行为c的随机变量;
根据已经发生的用户行为集合并结合一阶马尔科夫链模型计算当前时刻t可能发
生的用户行为集合;
对所述可能发生的用户行为集合进行划分,获得若干组划分后的集合;划分后的每
一组集合中均包含多个子集,再基于下式对每一组集合中的子集进行判断:
筛选出所有子集均可公开的集合;其中,s为用户设定
的隐私集合S中需要保护的用户行为,δ为隐私保护的程度,其值越小保护程度越高,
为包含已经发生的用户行为集合与当前子集的集合;
当发生某一真实用户行为时,选择包含该真实用户行为的子集向外发送,实现个人
行为数据匿名化。
2.根据权利要求1所述的方法,其特征在于,所述对所述可能发生的用户行为集合
进行划分,获得若干组划分后的集合,并基于下式进行筛选:
Pr[Xt=s|o′→]-Pr[Xt=s]≤δ,]]>获得所有子集均可公开的集合包括:
枚举所述可能发生的用户行为集合中所有的子集,获得若干组划分后的集合;
再根据隐私行为集合S判断每一子集是否可以公开;其中,满足下式
Pr[Xt=s|o′→]-Pr[Xt=s]≤δ,]]>则表示该子集可以公开;
从所述若干组划分后的集合中,筛选所有子集均可公开的集合;
从所述所有子集均可公开的集合中选择实用性最大的集合;其中,一个子集的实用
性为该子集的先验概率除以子集中用户行为的个数,一个集合的实用性为其子集的实用
性之和。
3.根据权利要求1或2所述的方法,其特征在于,集合中的每一子集中包含一个或多
个用户行为,若包含多个用户行为,则所述多个用户行为至少存在一个相同或相似...

【专利技术属性】
技术研发人员:孙广中魏燊周英华
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1