基于事务数据收集的支持度计数评估方法技术

技术编号：24409830 阅读：71 留言：0更新日期：2020-06-06 08:41

本发明专利技术提供一种基于事务数据收集的支持度计数评估方法，包括以下步骤：假设项支持度计数P

Support count evaluation method based on transaction data collection

全部详细技术资料下载

【技术实现步骤摘要】
基于事务数据收集的支持度计数评估方法
本专利技术涉及数据收集
，具体来说，尤其涉及一种基于事务数据收集的支持度计数评估方法。
技术介绍
事务数据是项的集合,其中包含丰富的信息并可应用于不同的场景(如：购买的商品,看过的电影记录,搜索日志,网页浏览历史等)。随着大数据技术的发展,海量的事务数据被收集,其中蕴含丰富的知识,数据收集者通过数据分析(如:协同过滤、关联规则等),基于得到的模型为用户提供更好的服务。然而,事务数据中往往包含个人隐私信息,如搜索网页时产生的搜索日志会泄露自己的健康状态、居住地点等信息；网上购物时产生的购物记录将泄露自己所购买的隐私物品,甚至会泄露自己的购物习惯以及行为模式；浏览网页时产生的WEB点击流将泄露自己的上网习惯等等。如果不采取任何保护措施直接收集并分析用户的数据,将会导致个人隐私信息的泄露,造成严重危害。震惊世界的AOL日志隐私泄露事件已敲响警钟,因隐私泄露所带来的困扰将严重影响着人们的合法权益和生活质量。目前,事务数据隐私保护发布是研究热点,大多数研究是将真实完整的事务数...

【技术保护点】
1.基于事务数据收集的支持度计数评估方法，其特征在于，包括以下步骤：/na1.假设项支持度计数P

【技术特征摘要】
1.基于事务数据收集的支持度计数评估方法，其特征在于，包括以下步骤：
a1.假设项支持度计数Pa＝#{ti|a∈ti,i∈[1,n]}，考虑项ai以及事务数据t,如果ai∈t,收集到的事务数据t′中同样包含ai的概率定义为真正率TPR；
a2.如果而收集到的事务数据t′中包含ai的概率定义为错正率FPR；
a3.考虑项ai∈I以及含有n个用户的事务数据集D＝{t1,t2,t3,...,tn},数据收集者得到的事务数据集为D′＝{t′1,t′2,t′3,...,t′n},假设其真实的项分布为得出ai在隐私事务数据t′的期望频率；
a4.进一步得到是对Pa的无偏估计。

2.根据权利要求1所述的基于事务数据收集的支持度计数评估方法，其特征在于，所述TPR的计算公式为：

假设样本空间大小为隐私参数α，事务数据t的长度均...

【专利技术属性】
技术研发人员：欧阳佳，肖政宏，刘少鹏，
申请(专利权)人：广东技术师范大学，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人