当前位置: 首页 > 专利查询>九江学院专利>正文

一种基于排序分类的个性化推荐中的隐私保护方法技术

技术编号:24456613 阅读:45 留言:0更新日期:2020-06-10 15:44
一种基于排序分类的个性化推荐中的隐私保护方法,该方法提出的ESPRC框架的核心是处理用户数据在提交给第三方推荐服务之前,让用户的隐私得到保障的情况下,可以享受来自第三方服务的高质量推荐;用户数据的混淆处理首先对用户数据进行排序再分类,得到高敏类数据和低敏类数据;再对用户的高敏类数据进行数据保序混淆;最后对用户的低敏类数据进行数据噪声混淆。既保护了用户数据效用又保障了用户隐私安全。

A privacy protection method in personalized recommendation based on sorting and classification

【技术实现步骤摘要】
一种基于排序分类的个性化推荐中的隐私保护方法
本专利技术涉及一种基于排序分类的个性化推荐中的隐私保护方法。
技术介绍
随着互联网技术的快速发展,用户频繁的在各大网络平台上分享自己的活动数据。例如标签、评分、签到等用户数据。正是这些大量的用户数据的发布,促进了个性化推荐服务的发展。所以,许多用户也愿意将自己的活动数据传输给第三方推荐平台来获取更高质量的个性化推荐。在本文中,我们也将用户数据称之为公共数据。但是,往往用户也会将一些数据看作是自己私有的,并不愿意对外开放,例如用户性别、用户疾病、用户收入水平等,这些都可以看作是用户的隐私数据。由于公共数据与隐私数据之间会存在某种关联,所以一些攻击者可以从公共数据中推测出用户的隐私数据,造成用户隐私泄露。所以需在用户公共数据传输给不信任的推荐平台前,保护用户的隐私数据是非常重要的。Sweeney,L.较早的提出了一个名为k-anonymity的正式保护模型,以及一组用于部署的随附策略,将其中每个人的信息与至少k-1个人的区分开,为真实系统提供隐私保护保证的基础。随着信息技术的发展,必须使用更复杂本文档来自技高网...

【技术保护点】
1.一种基于排序分类的个性化推荐中的隐私保护方法,其特征在于,该方法包括以下步骤:/na、用户数据建模:在形式上,用U表示用户集,I表示用户项目集即单个用户数据的数量,用D表示所有的用户数据,用Y表示所有的用户隐私数据;

【技术特征摘要】
1.一种基于排序分类的个性化推荐中的隐私保护方法,其特征在于,该方法包括以下步骤:
a、用户数据建模:在形式上,用U表示用户集,I表示用户项目集即单个用户数据的数量,用D表示所有的用户数据,用Y表示所有的用户隐私数据;,则用户u的数据集合表示为,大小为|I|,表示用户u的一种隐私数据,每个用户具有相同的数据量;在用户数据集合里可以展现这个用户对一些活动项目的喜爱程度,用表示用户u的某个数据;用户订阅第三方推荐服务时,服务提供者将立即访问用户的数据集,首先将用户数据按它的喜好程度进行排序,从高到低,分两类,一类是用户喜爱程度相对高的称为高敏类,另外一类是用户喜爱程度相对较低的称为低敏类;
b、对用户高敏类数据进行数据保序混淆,具体步骤如下:
1)首先对隐私泄露进行度量;混淆数据学习的主要思想是将用户高敏类数据混淆成另一个用户的高敏类数据,数据相似,但是隐私泄露减少了,并且还能用于第三方推荐服务;需要处理的用户数据为高敏类可以表示为,混淆后的用户数据表示为,该用户的隐私数据为;在确定的用户隐私数据的情况下,用户信息即为分别通过观察用户数据与用户混淆数据获取的信息量的差值,可用来表示用户隐私泄露量MI;信息量的大小可用信息论方法中的熵来表示,互信息与熵之间密不可分;则从用户数据中获取的信息量可以表示为H(),如公式(1)所示;

(1)
P()则表示用户数据中某个数据出现的概率;如需求得互信息的值,则还需要计算条件熵,与之间的条件熵如公式(2)所示;

(2)

与分别表示数据和数据的联合概率和条件概率;最终互信息的计算如公式(3)所示;




(3)
2)然后在隐私泄露较小的情况下同时保证个性化推荐的数据效用,就需要限定数据失真范围T即排序损失程度;使用肯德尔相关系数Tau,用逆序对数量来量化两个排序列表的不一致程度;用户原始数据和用户混淆数据取第i个数据分别用和表示;,如果有且>或者<且<时,则认为(,)与(,)是一对顺序一致的元素对,则其数量可表示为E。


2...

【专利技术属性】
技术研发人员:崔宗敏
申请(专利权)人:九江学院
类型:发明
国别省市:江西;36

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1