当前位置: 首页 > 专利查询>之江实验室专利>正文

一种结合评价文本的抗注入攻击的鲁棒推荐方法和系统技术方案

技术编号:28423255 阅读:15 留言:0更新日期:2021-05-11 18:31
本发明专利技术设计了一种结合评价文本的抗注入攻击的鲁棒推荐方法和系统。该方法包括:1)采用图神经网络模型,利用图上已知信息和计算出的统计信息,训练评价打分预测模型;2)利用文本生成模型和预测打分训练个性化评价文本生成模型;3)根据评价打分预测模型与个性化评价文本生成模型的预测值与真实值误差,训练攻击检测模型。本发明专利技术集评价打分预测模型、个性化评价文本生成模型、攻击检测模型于一体,使三个任务协同起来,互相促进。该方案充分利用评价文本信息,对“水军”用户产生的反馈数据做了更细粒度的划分和利用,同时可以自动缓解电商推荐平台中“注入攻击”对推荐精确度造成的影响,提升推荐算法的鲁棒性。

【技术实现步骤摘要】
一种结合评价文本的抗注入攻击的鲁棒推荐方法和系统
本方法属于信息
主要针对电商网站中的推荐系统,如何结合评价文本内容来分析用户兴趣与商品特点,自动化的识别哪些评价来自注入攻击,并降低这些评价在推荐系统中的影响。本专利技术利用个性化文本内容预测、评价打分预测、攻击检测三个部分相互促进,可以自动缓解电商推荐系统中注入攻击的问题,从而提升推荐系统的鲁棒性和准确性。
技术介绍
随着电商行业的发展,越来越多的用户选择网上购物。电商平台上有大量的商品可供用户选择,为了提升用户体验、加快用户的购买决策过程,电商平台使用推荐系统来猜测用户兴趣,为用户提供个性化的商品推荐。对电商平台来说,保证推荐系统的准确性是非常必要的。在众多推荐方法中,协同过滤是一个主流方法,它可以进一步分为基于记忆的协同过滤和基于模型的协同过滤。基于用户的协同过滤和基于商品的协同过滤统称为基于记忆的协同过滤,分别假定相似的用户有相似的兴趣、相似的商品有相似的特点。基于模型的协同过滤是将用户给商品的打分用矩阵表示,并分解成两个低维矩阵的乘积,本质是对打分矩阵进行矩阵补全。近来,深度学习的发展促进了推荐方法的发展,一系列深度协同过滤模型,通过联合学习代表用户兴趣的用户向量表示和代表商品特点的商品向量表示,提升了传统推荐方法的效果。电商平台中的用户、商品以及用户对商品的反馈数据,天然构成了一个图结构,图神经网络是建模图结构的有效方法,一系列基于图神经网络的深度协同过滤方法,进一步提升了推荐效果。然而,电商平台中的用户反馈数据不都是高质量且可信的,一些商家为了推广或诋毁目标商品,可能雇佣水军发布虚假的评价内容、给出不公平的打分,这种行为叫做“注入攻击”。一些研究表明,“注入攻击”的存在,会降低推荐系统的准确性,进而影响市场公平性。注意到这种情况,已有工作致力于减轻“注入攻击”对推荐系统的影响。一些方法关注如何通过利用鲁棒的模型,提升推荐系统鲁棒性;一些方法先对用户反馈进行虚假检测后,将虚假反馈去除掉,再运行推荐系统。最新的一个工作(GraphRfi)指出,这两种方法分别存在难以利用用户辅助信息和将正常数据误判为虚假并将其删除后可能导致模型越训越差的缺点,而将二者结合,可以各取所长、相互促进。具体地,GraphRfi分为评价打分预测和水军检测两个任务,分别用图卷积网络(GraphConvolutionalNetworks)和神经随机森林(NeuralRandomForests)进行学习,它们是联合训练的。在评价打分任务中,如果一个用户的评价打分与预测值显著不同,则该用户有很大可能是水军用户;在水军检测任务中,如果一个用户被分类为水军,则该用户的置信度可能会比较低,需要降低其在评价打分任务中的影响。我们注意到,上述结合图神经网络的协同过滤方法,在对图上信息的利用方面,仍是不充分的。它们主要利用节点(用户、商品)属性信息和边(用户对商品的反馈行为)上的用户打分,进行对评价打分的预测。然而,用户对商品的反馈不仅有对商品的打分,还有用户对商品的评价内容,蕴含着丰富的文本信息。这些丰富的文本信息可以更精确的体现用户的兴趣以及商品的特点。本专利技术专利的重点是扩展现有基于图的推荐算法,提升推荐算法对评价文本信息的捕捉能力。
技术实现思路
本专利技术提出了一种针对推荐系统中的“注入攻击”,结合丰富评价文本内容,自动化的鲁棒的推荐方法和系统。该方法集个性化文本内容预测、评价打分预测、攻击检测于一体,并可以互相促进。在后续描述过程中,本专利技术的数据模型记为图G=(U∪I,E),其中,U代表用户节点集合,I代表商品节点集合,E代表边(用户对商品产生反馈的关系)集合。用户节点u∈U,和商品节点i∈I上都有属性信息,边e∈E上有用户反馈信息(包括评价文本内容c∈C和用户给商品的打分r∈R,其中C是评价文本内容集合,R是用户给商品的打分集合)和产生反馈的具体时间戳t∈T(T为时间戳集合)。本专利技术采用的技术方案如下:本专利技术首先提供一种结合评价文本的抗注入攻击的鲁棒推荐模型训练方法,包括以下步骤:训练评价打分预测模型;根据评价打分预测模型预测的评价打分和产生的用户表示、商品表示,训练个性化评价文本生成模型;根据评价打分预测模型与个性化评价文本生成模型的预测值与真实值的误差,训练攻击检测模型,用于检测注入评价;根据攻击检测模型输出的注入评价检测结果,降低相应的评价在评价打分预测模型、个性化评价文本生成模型中的影响权重。进一步地,所述训练评价打分预测模型,是根据用户属性、商品属性、用户给商品的评价内容、打分以及用户产生反馈的时间,利用图神经网络训练得到用户、商品、反馈边的表示,得到所述评价打分预测模型;所述用户属性是能够反映用户是否异常的统计量。进一步地,上述步骤分成三个任务:个性化评价文本生成任务、评价打分预测任务和攻击检测任务,这三个任务互相作用、互相促进。具体地,个性化评价文本生成任务可以辅助评价打分预测任务;评价打分预测任务可以指导个性化评价文本生成任务;前两个任务的预测综合值如果与真实值有显著差异,则该评价有很大可能是注入评价;在攻击检测任务中,如果一个评价被分类为注入评价,则需要降低该评价在前两个任务中的影响(即控制影响权重)。进一步地,由于三个任务互相影响、互相促进,本专利技术设计统一的损失函数,使三个任务统一的、进行端到端的协同训练。具体地,对于评价打分预测任务,我们训练评价打分预测模型S(U,I,C,R,T)→R′,使得待测试边的预测分值R′接近于真实分值并且在训练评价打分预测模型时,需要根据攻击检测模型的输出降低虚假评价打分的影响权重。评价打分预测模型的损失函数:其中,pe表示边e真实的概率,r′e表示评价打分预测模型产生的边e的预测分值,表示边e的真实分值。对于个性化评价文本生成任务,我们训练个性化评价文本生成模型cg(U,I,C,R,T)→C′,使得待测试边的生成评价C′接近于真实评价进一步地,在训练个性化评价文本生成模型的时候加入评价打分预测模型产生的预测分值r′e进行指导。并且在训练个性化评价文本生成模型时,需要根据攻击检测模型的输出降低虚假评价内容的影响权重。同时,我们引入由评价内容预测评价打分的辅助模型f,通过利用评价打分预测模型产生的用户表示和商品表示进行个性化,评价打分预测模型和个性化评价文本生成模型利用同一套用户表示和商品表示共同训练,使得评价打分预测任务和个性化评价文本生成任务相互协同。个性化评价文本生成模型的损失函数:其中,pe表示边e真实的概率,c′e表示个性化评价文本生成模型生成的边e的评价,表示边e的真实评价。对于攻击检测任务,我们根据前两个任务中边上预测打分和生成的评价文本内容与真实打分、真实文本内容的差异情况,更新边表示(从而对新一轮更新时,评价打分预测任务中图神经网络的训练和个性化评价文本生成任务中生成模型的训练产生影响)。同时,根据更新的边表示,训练攻击检测模型预测边是否来自本文档来自技高网
...

【技术保护点】
1.一种结合评价文本的抗注入攻击的鲁棒推荐模型训练方法,其特征在于,包括以下步骤:/n训练评价打分预测模型;/n根据评价打分预测模型预测的评价打分和产生的用户表示、商品表示,训练个性化评价文本生成模型;/n根据评价打分预测模型与个性化评价文本生成模型的预测值与真实值的误差,训练攻击检测模型,用于检测注入评价;/n根据攻击检测模型输出的注入评价检测结果,降低相应的评价在评价打分预测模型、个性化评价文本生成模型中的影响权重。/n

【技术特征摘要】
1.一种结合评价文本的抗注入攻击的鲁棒推荐模型训练方法,其特征在于,包括以下步骤:
训练评价打分预测模型;
根据评价打分预测模型预测的评价打分和产生的用户表示、商品表示,训练个性化评价文本生成模型;
根据评价打分预测模型与个性化评价文本生成模型的预测值与真实值的误差,训练攻击检测模型,用于检测注入评价;
根据攻击检测模型输出的注入评价检测结果,降低相应的评价在评价打分预测模型、个性化评价文本生成模型中的影响权重。


2.根据权利要求1所述的方法,其特征在于,所述训练评价打分预测模型,是根据用户属性、商品属性、用户给商品的评价内容、打分以及用户产生反馈的时间,利用图神经网络训练得到用户、商品、反馈边的表示,得到所述评价打分预测模型;所述用户属性是能够反映用户是否异常的统计量。


3.据权利要求1所述的方法,其特征在于,所述方法包括三个任务:利用所述评价打分预测模型实现的评价打分预测任务、利用所述个性化评价文本生成模型实现的个性化评价文本生成任务、利用所述攻击检测模型实现的攻击检测任务;所述三个任务互相作用、互相促进:个性化评价文本生成任务辅助评价打分预测任务;评价打分预测任务指导个性化评价文本生成任务;在攻击检测任务中,如果一个评价被分类为注入评价,则降低该评价在前两个任务中的影响。


4.根据权利要求3所述的方法,其特征在于,采用统一的损失函数,使所述三个任务统一地进行端到端的协同训练,整体损失函数为:
L=Lrating+α·Lcontent_generate+β·Lfraudster
其中,Lrating为评价打分预测模型的损失函数,Lcontent_generate为个性化评价文本生成模型的损失函数,Lfraudster为攻击检测模型的损失函数,α、β表示控制三种损失比例的超参数。


5.根据权利要求4所述的方法,其特征在于,所述评价打分预测模型的损失函数为:



其中,pe表示边e真实的概率,r′e表示评价打分预测模型产生的边e...

【专利技术属性】
技术研发人员:张吉屈笑如高军
申请(专利权)人:之江实验室北京大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1