【技术实现步骤摘要】
基于事务数据收集的支持度计数评估方法
本专利技术涉及数据收集
,具体来说,尤其涉及一种基于事务数据收集的支持度计数评估方法。
技术介绍
事务数据是项的集合,其中包含丰富的信息并可应用于不同的场景(如:购买的商品,看过的电影记录,搜索日志,网页浏览历史等)。随着大数据技术的发展,海量的事务数据被收集,其中蕴含丰富的知识,数据收集者通过数据分析(如:协同过滤、关联规则等),基于得到的模型为用户提供更好的服务。然而,事务数据中往往包含个人隐私信息,如搜索网页时产生的搜索日志会泄露自己的健康状态、居住地点等信息;网上购物时产生的购物记录将泄露自己所购买的隐私物品,甚至会泄露自己的购物习惯以及行为模式;浏览网页时产生的WEB点击流将泄露自己的上网习惯等等。如果不采取任何保护措施直接收集并分析用户的数据,将会导致个人隐私信息的泄露,造成严重危害。震惊世界的AOL日志隐私泄露事件已敲响警钟,因隐私泄露所带来的困扰将严重影响着人们的合法权益和生活质量。目前,事务数据隐私保护发布是研究热点,大多数研究是将真实完整的事务数 ...
【技术保护点】
1.基于事务数据收集的支持度计数评估方法,其特征在于,包括以下步骤:/na1.假设项支持度计数P
【技术特征摘要】
1.基于事务数据收集的支持度计数评估方法,其特征在于,包括以下步骤:
a1.假设项支持度计数Pa=#{ti|a∈ti,i∈[1,n]},考虑项ai以及事务数据t,如果ai∈t,收集到的事务数据t′中同样包含ai的概率定义为真正率TPR;
a2.如果而收集到的事务数据t′中包含ai的概率定义为错正率FPR;
a3.考虑项ai∈I以及含有n个用户的事务数据集D={t1,t2,t3,...,tn},数据收集者得到的事务数据集为D′={t′1,t′2,t′3,...,t′n},假设其真实的项分布为得出ai在隐私事务数据t′的期望频率;
a4.进一步得到是对Pa的无偏估计。
2.根据权利要求1所述的基于事务数据收集的支持度计数评估方法,其特征在于,所述TPR的计算公式为:
假设样本空间大小为隐私参数α,事务数据t的长度均...
【专利技术属性】
技术研发人员:欧阳佳,肖政宏,刘少鹏,
申请(专利权)人:广东技术师范大学,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。