一种基于社交注意力机制表示学习的冷启动欺诈评论检测方法技术

技术编号:22295507 阅读:39 留言:0更新日期:2019-10-15 04:39
一种基于社交注意力机制表示学习的冷启动欺诈评论检测方法,基于给定在线评论数据集,构建表示用户、项目、评论和评分的实体关系的初始目标函数;根据评分构建用户间显示关系的显式用户特征矩阵以及用户间隐式关系的隐式用户特征矩阵,然后构建用户的社交耦合矩阵;采用注意力机制将用户的社交耦合矩阵整合到用户表示矩阵中,并对初始目标函数进行调整得到新的目标函数;确定新用户的注意力机制,根据已确定的分类器来识别评论是否为欺诈评论。本发明专利技术通过将实体关系、用户社交耦合关系和欺诈相关信息嵌入到社交注意力机制的用户表示空间中,从而有效解决了冷启动问题中缺少用户历史信息的缺陷,可有效地检测冷启动情况下的欺诈评论。

A Cold Start Fraud Review Detection Method Based on Social Attention Mechanism Representation Learning

【技术实现步骤摘要】
一种基于社交注意力机制表示学习的冷启动欺诈评论检测方法
本申请涉及计算机
,特别是涉及一种基于社交注意力机制表示学习的冷启动欺诈评论检测方法。
技术介绍
随着互联网的广泛应用,其丰富的信息资源给人们带来了极大的便利,同时网络用户发布的评论严重影响了人们的决策。互联网中存在的欺诈评论极大地损害了用户的决策,欺诈者撰写欺诈评论来混淆诚实用户可以获得卓越的商业价值和声誉。现有的方法大多基于用户的评论内容来进行欺诈评论检测,但是当新用户刚刚发布新评论时,因为缺乏足够的新用户历史记录信息而导致基于评论内容的检测方法失效,这类问题称为冷启动问题。现有的方法面对冷启动问题时面临极大的挑战,一是缺乏足够的新用户历史记录,二是无法提取有效的用户行为特征。冷启动问题是近几年来互联网应用中十分关注的问题,无论是从企业的商业价值和声誉考虑,还是用互联网用户的切身利益出发,都要求能有有效解决冷启动问题下欺诈评论的检测问题,才能保证互联网平台提供更好的服务,有效检测和监管互联网上的欺诈评论行为。最近有一些对欺诈评论检测的冷启动问题的研究。第一种方法是通过用户建模作为用户、项目和评论之间关系的行为,以解决冷启动问题中缺乏用户历史信息的问题。第二种方法是通过挖掘涉及用户、项目以及评论之前关系的属性和领域知识,这种方法取得了更好的冷启动欺诈评论检测性能。尽管上述两种方法考虑了用户、项目、评论的关系,并最终将这种关系嵌入到欺诈评论中,但只有评论内容被用作欺诈识别的证据。但是评论内容很容易被操纵,因此欺诈者可能会伪装成诚实评论来构造欺诈评论。因此,这些方法可能无法检测在现实世界中广泛存在的欺诈评论。此外,这两类方法忽略了用户之间社交关系以及用户之间可能存在的协作操纵。后来有研究提出一种新方法检测冷启动欺诈评论。具体而言,它同时嵌入用户、项目、评论实体关系和用户社交关系到用户表示空间,并根据其发布的用户识别欺诈评论的表示空间。虽然性能明显提高,但此方法仅捕获用户共同评论关系,忽略其他关系复杂的社交关系,如用户具有同样的态度和类似的偏好。此外,该方法不考虑实体关系学习过程中的有关的欺诈信息,有可能减少特别是在冷启动情况下的欺诈评论检测精度。
技术实现思路
欺诈评论是当前的网络空间安全的一大危害,它极大的损害了用户的决策。当前有很多欺诈评论检测的方法被提出,但是由于缺乏新用户足够的历史信息,现有的欺诈评论检测技术在冷启动的情况下往往会失效。本专利技术针对该问题提出一种基于社交注意力机制表示学习的冷启动欺诈评论检测方法。一种基于社交注意力机制表示学习的冷启动欺诈评论检测方法,包括:给定在线评论数据集,提取出分别表示用户、项目、评论和评分的表示矩阵Vu、Vo、Vr和Vs,根据表示矩阵Vu、Vo、Vr和Vs构建表示用户、项目、评论和评分的实体关系的初始目标函数;根据评分构建用户间显示关系的显式用户特征矩阵Mexp以及用户间隐式关系的隐式用户特征矩阵Mimp;基于显式用户特征矩阵Mexp和隐式用户特征矩阵Mimp学习用户间的复杂耦合关系,构建用户的社交耦合矩阵C;采用注意力机制将用户的社交耦合矩阵C整合到用户表示矩阵Vu中,得到新的用户表示矩阵Vu*;基于新的用户表示矩阵Vu*对初始目标函数进行调整得到新的目标函数,将其作为最终的冷启动欺诈评论检测目标函数;对冷启动欺诈评论检测目标函数进行优化学习得到分类器,基于学习到的分类器来识别评论是否为欺诈评论。本专利技术中,所构建的初始目标函数为:其中:Φ={w,p,w,b}表示初始目标函数其参数w,p,w,b的集合,待求量;yi表示在线评论集合S中第i个在线评论活动vi是否为欺诈评论的标签值,该标签值由人工标注;yi为0代表可靠评论活动,yi为1代表欺诈评论活动;y={0,1}由公式(1)中第一项的第二个累加项定义,是累加项中的变量值;1[yi=y]表示返回一个向量,当yi为0时,向量为[1,0];当yi为1时,向量为[0,1];qi=softmax(wDp([vu,vo,vs,vr])+b),<u,o,s,r>∈vi;Dp(·)表示参数为p的全连接网络;softmax(·)为归一化指数函数;S表示输入的在线评论数据集,在线评论数据集S中包含一系列的在线评论活动vi,每一个在线评论活动vi的定义为一个用户对于一个项目进行评论和评分,每一个在线评论活动vi中的元素包括<u,o,r,s>,u,o,r,s分别表示用户、项目、评论和评分;nv表示在线评论数据集中在线评论活动的总数量;u′代表不在在线评论数据集S中的在线评论活动v中包含的一个用户;u=u′代表用户u和u′为同一用户,u≠u′代表用户u和u′为不同用户;V={Vu,Vo,Vs},是用户表示矩阵,项目表示矩阵和评分表示矩阵的集合;向量vu,vo,vs分别表示用户表示矩阵Vu中对应于用户u的一行,项目表示矩阵Vo中对应于项目o的一行以及评分表示矩阵Vs中对应于评分s的一行;yi表示在线评论活动vi的真实标签;Dp(·)表示参数为p的全连接网络;vr=tw(r),tw(·)表示参数为w的一个文本嵌入神经网络;max(·)表示一个返回集合最大值的函数。在本专利技术中,显式用户特征矩阵Mexp其每行对应一个用户,每列对应一个显式用户特征,显式用户特征矩阵Mexp中每个元素表示第i个用户ui给第j个项目oj的评分sij,即为sij;若ui没有评论oj,则相应的值置为0,即为0;隐式用户特征矩阵Mimp其每行对应一个用户,每列对应一个隐式用户特征,隐式用户特征为用户的离散化后的属性信息对应的属性值,属性信息包括但不限于用户的年龄、职业、教育程度或/和薪水等级等;隐式用户特征矩阵Mimp中每个元素表示第i个用户ui给第j个属性值。在本专利技术中,构建用户的社交耦合矩阵C的方法如下:(1)通过公式(2)学习以及的属性内耦合关系表示:其中,Mij表示或Mij为表示求解的是显式用户矩阵的属性内耦合关系,Mij为表示求解的是隐式用户矩阵的属性内耦合关系;g(Mij)表示特征值为Mij的用户集合;|·|表示集合的大小;nu表示在线评论数据集S中包含的用户数量;(2)通过公式(3)学习以及的属性间耦合关系表示,其中,Mij表示或Mij为表示求解的是显式用户矩阵的属性间耦合关系,Mij为表示求解的是隐式用户矩阵的属性间耦合关系;表示除了第j列特征之外所有特征中特征值构成集合中的第k个值;p(Mij|Mk*)表示在用户特征中Mij和Mk*同时出现的频率,可以通过公式(4)计算:其中代表特征值为的用户集合;(3)通过公式(5)结合Mij的属性内和属性间耦合关系表示,从而得到Mij的耦合关系表示:其中nf为矩阵M的特征维度。矩阵M是显式用户矩阵Mexp和隐式用户矩阵Mimp的抽象表示。即Mij为则公式(5)中的nf为显式用户矩阵Mexp的特征维度;Mij为则公式(5)中的nf为隐式用户矩阵Mimp的特征维度。(4)采用线性核在耦合表示空间上构建用户的社交耦合矩阵C,如公式(6)所示:在本专利技术中,新的用户表示矩阵Vu*的获取方法如下:a.采用公式(7)将社交耦合矩阵C中的每一个耦合值转换成概率值,得到权重矩阵C*:其中exp(·)是指数函数;b.通过公式得到调整后的新本文档来自技高网
...

【技术保护点】
1.一种基于社交注意力机制表示学习的冷启动欺诈评论检测方法,其特征在于,方法包括:给定在线评论数据集,提取出分别表示用户、项目、评论和评分的表示矩阵Vu、Vo、Vr和Vs,根据表示矩阵Vu、Vo、Vr和Vs构建表示用户、项目、评论和评分的实体关系的初始目标函数;根据评分构建用户间显示关系的显式用户特征矩阵M

【技术特征摘要】
1.一种基于社交注意力机制表示学习的冷启动欺诈评论检测方法,其特征在于,方法包括:给定在线评论数据集,提取出分别表示用户、项目、评论和评分的表示矩阵Vu、Vo、Vr和Vs,根据表示矩阵Vu、Vo、Vr和Vs构建表示用户、项目、评论和评分的实体关系的初始目标函数;根据评分构建用户间显示关系的显式用户特征矩阵Mexp以及用户间隐式关系的隐式用户特征矩阵Mimp;基于显式用户特征矩阵Mexp和隐式用户特征矩阵Mimp学习用户间的复杂耦合关系,构建用户的社交耦合矩阵C;采用注意力机制将用户的社交耦合矩阵C整合到用户表示矩阵Vu中,得到新的用户表示矩阵Vu*;基于新的用户表示矩阵Vu*对初始目标函数进行调整得到新的目标函数,将其作为最终的冷启动欺诈评论检测目标函数;对冷启动欺诈评论检测目标函数进行优化学习得到分类器,基于学习到的分类器来识别评论是否为欺诈评论。2.根据权利要求1所述的基于社交注意力机制表示学习的冷启动欺诈评论检测方法,其特征在于:初始目标函数为其中:Φ={w,p,w,b}表示初始目标函数其参数w,p,w,b的集合,待求量;yi表示在线评论集合S中第i个在线评论活动vi是否为欺诈评论的标签值,该标签值由人工标注;yi为0代表可靠评论活动,yi为1代表欺诈评论活动;y={0,1}由公式(1)中第一项的第二个累加项定义,是累加项中的变量值;1[yi=y]表示返回一个向量,当yi为0时,向量为[1,0];当yi为1时,向量为[0,1];qi=softmax(wDp([vu,vo,vs,vr])+b),<u,o,s,r>∈vi;Dp(·)表示参数为p的全连接网络;softmax(·)为归一化指数函数;S表示输入的在线评论数据集,在线评论数据集S中包含一系列的在线评论活动vi,每一个在线评论活动vi的定义为一个用户对于一个项目进行评论和评分,每一个在线评论活动vi中的元素包括<u,o,r,s>,u,o,r,s分别表示用户、项目、评论和评分;nv表示在线评论数据集中在线评论活动的总数量;u′代表不在在线评论数据集S中的在线评论活动v中包含的一个用尸;u=u′代表用户u和u′为同一用户,u≠u′代表用户u和u′为不同用户;V={Vu,Vo,Vs},是用户表示矩阵,项目表示矩阵和评分表示矩阵的集合;向量vu,vo,vs分别表示用户表示矩阵Vu中对应于用户u的一行,项目表示矩阵Vo中对应于项目o的一行以及评分表示矩阵Vs中对应于评分s的一行;yi表示在线评论活动vi的真实标签;Dp(·)表示参数为p的全连接网络;vr=tw(r),tw(·)表示参数为w的一个文本嵌入神经网络;max(.)表示一个返回集合最大值的函数。3.根据权利要求2所述的基于社交注意力机制表示学习的冷启动欺诈评论检测方法,其特征在于:显式用户特征矩阵Mexp其每行对应一个用户,每列对应一个显式用户特征,显式用户特征矩阵Mexp中每个元素表示第i个用户ui给第j个项目oj的评分sij,即为sij;若ui没有评论oj,则相应的值置为0,即为0;隐式用户特征矩阵Mimp其每行对应一个用户,每列对应一个隐式用户特征,隐式用户特征为用户的离散化后的属性信息对应的属性值,属性信息包括但不限于用户的年龄、职业、教育程度或/和薪水等级;隐式用户特征矩阵Mimp中每个元素表示第i个用户ui给第j个属性值。4.根据权利要求3所述的基于社交注意力机制表示学习的冷启动欺诈评论检测方法,其特征在于:构建用户的社交耦合矩阵C的方法如下:(1)通过公式(2)学习以及的属性内耦合关系表示:其中,Mij表示或Mij为表示求解的是显式用户矩阵的属性内耦合关系,Mij为表示求解的是隐式用户矩阵的属性内耦合关系;g(Mij)表示特征值为Mij的用户集合;|·|表示集合的大小;nu表示在线评论数据集S中包含的用户数量;(2)通过公式(3)学习以及的属性间耦合关系表示,其中,Mij表示或Mij为表示求解的是显式用户矩阵的属性间耦合关系...

【专利技术属性】
技术研发人员:赵文涛朱成璋刘丹李倩李盼达乔博
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1