当前位置: 首页 > 专利查询>天津大学专利>正文

一种在线社交网络垃圾评论用户检测方法技术

技术编号:38029784 阅读:14 留言:0更新日期:2023-06-30 10:56
本发明专利技术涉及一种在线社交网络垃圾评论用户检测方法,包括下列步骤:步骤一,图构建和预处理:以在线社交平台用户为节点,用户间的交互关系为边建立图结构,构建邻接矩阵;人工标注部分数据,给出被标注的节点的编号及标签,1代表垃圾评论发送者,0代表正常用户;建立置信度向量;步骤二,图神经网络构建:图神经网络共包含两层,最后一层的输出维度为2,第1维代表神经网络将节点判定为垃圾评论发送者的置信度,第2维代表神经网络将节点判定为正常用户的置信度,图神经网络通过聚合节点邻居的特征来获取节点自己的特征,在提取节点特征时考虑其邻居的类别信息,对于不同类型的邻居执行不同的特征聚合策略;步骤三,迭代优化。迭代优化。迭代优化。

【技术实现步骤摘要】
一种在线社交网络垃圾评论用户检测方法


[0001]本专利技术属于数据挖掘领域,涉及一种基于图神经网络的异常检测方法。该方法将在线社交网络建模为图,将垃圾评论用户视为在线社交网络中的异常节点,使用融合边信息的图神经网络抽取在线社交网络用户的特征,并将特征输入到分类器中进行半监督异常检测。

技术介绍

[0002]随着互联网的发展,涌现了越来越多的在线平台,例如微博,大众点评,豆瓣等。随着用户基数的提升,这些在线平台上的无意义的评论和恶意的评论越来越多。另外,一些不良商家为了刷好评率会雇佣专门的刷分账号在其产品下发送好评评论。这些恶意用户严重扰乱了各类在线平台的可信度。仅采用人工的方式进行审查会消耗大量的人力,因此垃圾评论用户的智能化检测的需求越来越高。
[0003]通过将用户建模为节点,用户间的各种交互关系为边可以为在线社交平台建立在线社交网络,从而可以使用基于图的算法来检测垃圾评论发送者。由于图数据的复杂性以及垃圾评论发送者的伪装性等特点,垃圾评论发送者检测依然面临着多种挑战。
[0004]图神经网络由于其在图特征提取上的出色性能被广泛应用于各类的图学习的任务中。FdGars
[1]就是一种使用图神经网络检测垃圾评论发送者的方法。但是为了避免被算法检测,垃圾评论发送者可能会产生一些伪装行为,例如与大量正常用户建立正常交互,或者将自己的用户属性和发送的评论进行伪装,使其与正常的用户属性和评论相似。此时就需要对图神经网络的结构进行优化以适应存在伪装行为时的垃圾评论发送者检测任务。
[0005][1]Wang J,Wen R,Wu C,et al.FdGars:Fraudster Detection via Graph ConvolutionalNetworks in Online App Review System[C].In Companion of The 2019 WorldWide Web Conference,2019:310

316

技术实现思路

[0006]本专利技术的主要目的是提供一种在线社交网络垃圾评论用户检测方法,用来更为精准地检测社交网络中的垃圾评论发送者。技术方案如下:
[0007]一种在线社交网络垃圾评论用户检测方法,包括下列步骤:
[0008]步骤一,图构建和预处理
[0009](1)以在线社交平台用户为节点,用户间的交互关系为边建立图结构,构建邻接矩阵;
[0010](2)将用户属性数值化,构建属性矩阵,属性矩阵每行代表对应的用户的属性;
[0011](3)人工标注部分数据,给出被标注的节点的编号及标签,1代表垃圾评论发送者,0代表正常用户,并划分训练集和测试集;
[0012](4)建立一个置信度向量其中N代表节点个数,第i位为0时代表节点i更可能为正常用户,第i位为1时代表节点i更可能为垃圾评论发送者;初始化该置信度向量,使
训练集中标签为0的节点在B中对应的位置为0,使训练集中标签为1的节点在B中对应的位置为1,其余位置均为0;
[0013]步骤二,图神经网络构建
[0014]图神经网络共包含两层,最后一层的输出维度为2,第1维代表神经网络将节点判定为垃圾评论发送者的置信度,第2维代表神经网络将节点判定为正常用户的置信度,图神经网络通过聚合节点邻居的特征来获取节点自己的特征,在提取节点特征时考虑其邻居的类别信息,对于不同类型的邻居执行不同的特征聚合策略;
[0015]对于每一层图神经网络均包含以下过程:
[0016](1)使用全连接层将用户u的特征h
u
降维得到降维后的用户特征z
u
,公式如下:
[0017]z
u
=W
t
h
u
[0018]其中,为全连接层的权重矩阵,d
in
为该层输入维度,d
out
为该层输出维度;
[0019](2)将节点v视为中心节点,对于节点v在关系r下的每一个邻居u,按照其与中心节点的关系计算其重要性系数公式如下:
[0020][0021]其中,为可训练的权重向量;
[0022](3)根据置信度向量B判断节点的邻居是否与其同类,将关系r下的节点v的同类邻居放到集合中,异类邻居放到集合中;
[0023](4)将两类邻居的重要性系数分别进行归一化操作,得到用以聚合的注意力分数;对于节点v在关系r下的邻居u,如果节点u与节点v同类,则其注意力分数由以下公式求得:
[0024][0025]其中,为节点v的同类邻居的集合;exp为自然指数函数;σ为非线性激活函数;同理,如果该邻居节点与节点v异类,则其注意力分数由以下公式求得:
[0026][0027]其中,为节点v的异类邻居的集合;
[0028](5)根据上一步计算得到的注意力分数分别计算关系r下中心节点v的同类邻居的嵌入和中心节点v的异类邻居的嵌入其计算公式如下:
[0029][0030][0031](6)对于每个节点v,以其特征z
v
与其他节点特征的欧式距离为依据获取其k近邻节点构成k近邻图
[0032](7)按照进行一次聚合操作获取到每个节点v的k近邻嵌入h
knn,v
,公式如下:
[0033][0034]其中,K为k近邻选取的邻居数;为权重矩阵;为节点v的k近邻集合;
[0035](8)对于每一个节点v,将其同类邻居嵌入异类邻居嵌入和k近邻嵌入h
knn,v
融合可得到关系r下节点v的综合嵌入
[0036](9)引入多头注意力机制,重复步骤(1)到步骤(8)共H次,并将这些拼接得到关系r下的多头注意力后节点v的特征
[0037](10),采用拼接和线性变换操作将多关系下的整合为h

v

[0038]堆叠两个图神经网络层后得到最后一层的输出h
v,out
,该输出是一个二维向量;第1维代表节点v为垃圾评论发送者的置信度,第2维代表节点v为正常用户的置信度;对h
v,out
取softmax操作后即可表示节点属于正常节点和异常节点的概率值;当h
v,out
的第0维的值大于第1维的值时,该节点被判定为正常节点;当h
v,out
的第1维的值大于第0维的值时,该节点被判定为异常节点;
[0039]步骤三,迭代优化
[0040](1)将整个图输入到图神经网络中,获取输出结果h
out
,是全部的h
v,out
的纵向拼接;
[0041](2)对训练标签进行欠采样得到参与损失计算的节点集合使得参与损失计算的正常节点数量与异常节点数量相近,以避免标签01不均衡的影响;
[0042](3)按以下公式计算的损失
[0043][0044]其中,y
v...

【技术保护点】

【技术特征摘要】
1.一种在线社交网络垃圾评论用户检测方法,包括下列步骤:步骤一,图构建和预处理(1)以在线社交平台用户为节点,用户间的交互关系为边建立图结构,构建邻接矩阵;(2)将用户属性数值化,构建属性矩阵,属性矩阵每行代表对应的用户的属性;(3)人工标注部分数据,给出被标注的节点的编号及标签,1代表垃圾评论发送者,0代表正常用户,并划分训练集和测试集;(4)建立一个置信度向量其中N代表节点个数,第i位为0时代表节点i更可能为正常用户,第i位为1时代表节点i更可能为垃圾评论发送者;初始化该置信度向量,使训练集中标签为0的节点在B中对应的位置为0,使训练集中标签为1的节点在B中对应的位置为1,其余位置均为0;步骤二,图神经网络构建图神经网络共包含两层,最后一层的输出维度为2,第1维代表神经网络将节点判定为垃圾评论发送者的置信度,第2维代表神经网络将节点判定为正常用户的置信度,图神经网络通过聚合节点邻居的特征来获取节点自己的特征,在提取节点特征时考虑其邻居的类别信息,对于不同类型的邻居执行不同的特征聚合策略;对于每一层图神经网络均包含以下过程:(1)使用全连接层将用户u的特征h
u
降维得到降维后的用户特征z
u
,公式如下:z
u
=W
t
h
u
其中,为全连接层的权重矩阵,d
in
为该层输入维度,d
out
为该层输出维度;(2)将节点v视为中心节点,对于节点v在关系r下的每一个邻居u,按照其与中心节点的关系计算其重要性系数公式如下:其中,为可训练的权重向量;(3)根据置信度向量B判断节点的邻居是否与其同类,将关系r下的节点v的同类邻居放到集合中,异类邻居放到集合中;(4)将两类邻居的重要性系数分别进行归一化操作,得到用以聚合的注意力分数;对于节点v在关系r下的邻居u,如果节点u与节点v同类,则其注意力分数由以下公式求得:其中,为节点v的同类邻居的集合;exp为自然指数函数;σ为非线性激活函数;同理,如果该邻居节点与节点v异类,则其注意力分数由以下公式求得:
其中,为节点v的异类邻居的集合;(5)根据上一步计算得到的注意力分数分别计算关系r下中心节点v的同类邻居的嵌入和中心节点v的异类邻居的嵌入其计算公式如...

【专利技术属性】
技术研发人员:杨泽戴维迪邵明来李天鹏
申请(专利权)人:天津大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1