System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 差分隐私保护下基于联邦学习和多臂赌博机的商品推荐方法技术_技高网
当前位置: 首页 > 专利查询>安徽大学专利>正文

差分隐私保护下基于联邦学习和多臂赌博机的商品推荐方法技术

技术编号:40712914 阅读:4 留言:0更新日期:2024-03-22 11:15
本发明专利技术公开了一种差分隐私保护下基于联邦学习和多臂赌博机的商品推荐方法,其步骤包括:1、中央服务器及各个终端初始化参数;2、对所有候选商品进行推荐并获得对应用户评分奖励反馈;3、以上一步奖励结果为初始参数,选择用户评分最高的商品(局部最优)进行推荐并获得对应用户评分;4、将之前所获得的奖励反馈进行聚合;5、对聚合结果加入噪声进行扰动,并将扰动后的参数上传至中央服务器;6、中央服务器根据上传的数据确定淘汰集;7、删除淘汰集内的候选商品后进行迭代,直至得到最终的推荐商品。本发明专利技术能够在分布式环境下有效解决商品推荐系统中的冷启动问题,同时保护用户隐私信息。

【技术实现步骤摘要】

本专利技术属于推荐系统领域,具体的说是一种差分隐私保护下基于联邦学习和多臂赌博机的商品推荐方法


技术介绍

1、身处大数据时代,数据量是否足够已然不是我们需要担心的问题,相比于此,数据的安全问题显然更需要我们的关注,越来越多的国家和地区都开始通过立法的方式来保护用户的隐私安全。同时,信息过载也是大数据时代的负面影响之一,而推荐系统则为了解决信息过载提供了可行的思路。通过获取用户的历史信息,推荐系统可以从中分析出用户的相关偏好,从而给用户推荐更加符合其偏好的商品,从而实现生产者与消费者的双赢。

2、然而,现有的推荐算法对用户信息的使用可能会导致严重的信息安全问题,用户的购买记录、浏览记录、收藏记录都属于用户敏感信息,在上传给第三方后,可能由于第三方不可信使得这些信息泄露,从而造成用户的财产损失、隐私侵犯、信用损害等后果。同时,推荐系统对用户信息过于依赖,在对新用户、新商品进行推荐时由于信息不够完善会导致冷启动问题,使得推荐效率低下。最后,在这个数据量爆炸的时代,使用集中式系统来进行计算已然不现实,因此,如何在不泄露用户敏感信息的情况下实现一个能解决冷启动问题的分布式推荐方法变得极其重要。


技术实现思路

1、本专利技术是为了解决上述场景下存在的问题,提出一种差分隐私保护下基于联邦学习和多臂赌博机的商品推荐方法,以期能有效解决现有场景下主流方案中用户敏感数据容易泄露的安全性问题、无法进行分布式计算的问题、以及现有推荐系统的冷启动问题,从而能更好的运用海量数据、保护用户的隐私信息、能提升商品推荐效率。

2、本专利技术为达到上述专利技术目的,采用如下技术方案:

3、本专利技术一种差分隐私保护下基于联邦学习和多臂赌博机的商品推荐方法的特点是应用于由一个中央服务器、m个客户端、一个候选商品集a={a1,a2,…,ak,…,ak}所构成的网络环境中,其中,ak表示第k个候选商品,k表示候选商品的总数,m为客户端的数量,所述商品推荐方法是按如下步骤进行:

4、步骤1、所述中央服务器及各个客户端初始化商品推荐的参数:

5、定义当前训练轮次为t,并初始化t=1;定义总训练轮次为t,训练步长为fp,且fp=10log(t),定义活跃候选商品集为a',并初始化a'=a;

6、步骤2、第t次迭代下各个客户端对a'中所有候选商品进行推荐并获得对应的奖励反馈向量:

7、步骤2.1、定义候选商品重复推荐的总次数为n,且n=min(t-t,fp);定义当前推荐次数为n,并初始化n=1;

8、定义第t次迭代下第k个候选商品ak第n次推荐给第m个客户端所获得的累计奖励反馈为rtm,n,k,并初始化rtm,n,k=0;

9、定义第t次迭代下第k个候选商品ak第n次推荐给第m个客户端的推荐次数为ptm,n,k,并初始化ptm,n,k=0;

10、定义并初始化参考奖励向量为r0m;

11、初始化参考推荐次数向量为p0m;

12、步骤2.2、初始化k=1;

13、步骤2.3、第t次迭代下将第k个候选商品ak第n次推荐给第m个客户端,并得到在第n次推荐下第m个客户端对第k个候选商品ak的评分δtm,n,k,将rtm,n,k+δtm,n,k赋值给rtm,n,k;将ptm,n,k+1赋值给ptm,n,k;

14、步骤2.4、k+1赋值给k后,返回步骤2.3顺序执行,直到k>k为止,从而得到第t次迭代下的第n次推荐时第m个客户端对a'中所有候选商品的累计评分向量

15、rtm,n={rtm,n,k|k=1,2,…,k}以及a'中所有候选商品推荐给第m个客户的推荐次数向量

16、ptm,n={ptm,n,k|k=1,2,…,k};

17、步骤3、第t次迭代下各个客户端从a'中选择局部最优的商品进行推荐并获得对应的奖励反馈:

18、步骤3.1、定义并初始化第t次迭代下第k个候选商品ak第n次推荐给第m个客户端时参考奖励的期望φtm,n,k=rtm,n,k/ptm,n,k,从而得到第t次迭代下所有候选商品第n次推荐给第m个客户端时参考奖励的期望向量φtm,n={φtm,n,k|k=1,2,…,k};

19、根据式(1)计算第t次迭代下第k个候选商品ak第n次推荐给第m个客户端的置信半径δtm,n,k:

20、

21、步骤3.2、定义第t次迭代下第k个候选商品ak第n次推荐给第m个客户端所获得的累计奖励反馈为r'tm,n,k,并初始化r'tm,n,k=0;

22、定义第t次迭代下第k个候选商品ak第n次推荐给第m个客户端的推荐次数为sm,n,k,并初始化sm,n,k=0;

23、步骤3.3、计算第t次迭代下第k个候选商品ak在第n次推荐给第m个客户端时的置信上界ltm,n,k=φtm,n,k+δtm,n,k;从而得到第t次迭代下所有候选商品在第n次推荐给第m个客户端时的置信上界ltm,n={ltm,n,k|k=1,2,…,k};

24、步骤3.4、从ltm,n中选择最大值所对应的候选商品并作为局部最优的商品am,max推荐给第m个客户端,并得到第t次迭代下第m个客户端对第n次推荐的最优商品am,max的评分δ'tm,n,max,将r'tm,n,max+δ'tm,n,max赋值给r'tm,n,max;并将sm,n,max+1赋值给sm,n,max;其中,r'tm,n,max表示第t次迭代下最优商品am,max第n次推荐给第m个客户端所获得的累计奖励反馈,sm,n,max表示第t次迭代下最优商品am,max第n次推荐给第m个客户端的推荐次数;max∈[1,k];

25、步骤3.5、根据r'tm,n,max得到第t次迭代下第m个客户端在第n次推荐时对所有候选商品的累计评分向量itm,n;根据sm,n,max得到第t次迭代下第m个客户端在第n次推荐时对所有候选商品的推荐次数向量stm,n;

26、步骤3.6、将(r0m+itm,n)/(p0m+stm,n)赋值给φtm,n;当n=1时,令r0m=rtm,n,p0m=ptm,n;

27、步骤3.7、将n+1赋值给n后,判断n>n是否成立,若成立,则表示得到第t次迭代下第n次推荐时第m个客户端的累计评分向量rtm,n并赋值给最终累计评分向量rtm,得到第t次迭代下第m个客户端在第n次推荐时对所有候选商品的累计评分向量itm,n并赋值给最终累计评分向量itm、得到第t次迭代下的第n次推荐时a'中所有候选商品推荐给第m个客户的推荐次数向量ptm,n并赋值给最终推荐次数向量ptm、得到第t次迭代下第m个客户端在第n次推荐时对所有候选商品的推荐次数向量stm,n并赋值给最终推次数向量stm,否则,返回步骤2.2顺序执行,

28、步骤4、利用式(2)计算第t次迭代下第m个客户端的推荐参数向量gtm={gtm,k|k=1,2本文档来自技高网...

【技术保护点】

1.一种差分隐私保护下基于联邦学习和多臂赌博机的商品推荐方法,其特征是应用于由一个中央服务器、M个客户端、一个候选商品集A={a1,a2,…,ak,…,aK}所构成的网络环境中,其中,ak表示第k个候选商品,K表示候选商品的总数,M为客户端的数量,所述商品推荐方法是按如下步骤进行:

2.根据权利要求1所述的商品推荐方法,其特征在于,所述步骤5包括:

3.一种电子设备,包括存储器以及处理器,其特征在于,所述存储器用于存储支持处理器执行权利要求1或2所述商品推荐方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。

4.一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行权利要求1或2所述商品推荐方法的步骤。

【技术特征摘要】

1.一种差分隐私保护下基于联邦学习和多臂赌博机的商品推荐方法,其特征是应用于由一个中央服务器、m个客户端、一个候选商品集a={a1,a2,…,ak,…,ak}所构成的网络环境中,其中,ak表示第k个候选商品,k表示候选商品的总数,m为客户端的数量,所述商品推荐方法是按如下步骤进行:

2.根据权利要求1所述的商品推荐方法,其特征在于,所述步骤5...

【专利技术属性】
技术研发人员:张顺叶梦成毛小虎梁清荷段灏宇余元庆崔小娟王学军
申请(专利权)人:安徽大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1