一种在线社交网络垃圾评论用户检测方法技术

技术编号：38029784 阅读：14 留言：0更新日期：2023-06-30 10:56

本发明专利技术涉及一种在线社交网络垃圾评论用户检测方法，包括下列步骤：步骤一，图构建和预处理：以在线社交平台用户为节点，用户间的交互关系为边建立图结构，构建邻接矩阵；人工标注部分数据，给出被标注的节点的编号及标签，1代表垃圾评论发送者，0代表正常用户；建立置信度向量；步骤二，图神经网络构建：图神经网络共包含两层，最后一层的输出维度为2，第1维代表神经网络将节点判定为垃圾评论发送者的置信度，第2维代表神经网络将节点判定为正常用户的置信度，图神经网络通过聚合节点邻居的特征来获取节点自己的特征，在提取节点特征时考虑其邻居的类别信息，对于不同类型的邻居执行不同的特征聚合策略；步骤三，迭代优化。迭代优化。迭代优化。

全部详细技术资料下载

【技术实现步骤摘要】
一种在线社交网络垃圾评论用户检测方法

[0001]本专利技术属于数据挖掘领域，涉及一种基于图神经网络的异常检测方法。该方法将在线社交网络建模为图，将垃圾评论用户视为在线社交网络中的异常节点，使用融合边信息的图神经网络抽取在线社交网络用户的特征，并将特征输入到分类器中进行半监督异常检测。

技术介绍

[0002]随着互联网的发展，涌现了越来越多的在线平台，例如微博，大众点评，豆瓣等。随着用户基数的提升，这些在线平台上的无意义的评论和恶意的评论越来越多。另外，一些不良商家为了刷好评率会雇佣专门的刷分账号在其产品下发送好评评论。这些恶意用户严重扰乱了各类在线平台的可信度。仅采用人工的方式进行审查会消耗大量的人力，因此垃圾评论用户的智能化检测的需求越来越高。
[0003]通过将用户建模为节点，用户间的各种交互关系为边可以为在线社交平台建立在线社交网络，从而可以使用基于图的算法来检测垃圾评论发送者。由于图数据的复杂性以及垃圾评论发送者的伪装性等特点，垃圾评论发送者检测依然面临着多种挑战。
[0004]图神经网络由于其在图特征提取上的出色性能被广泛应用于各类的图学习的任务中。FdGars
[1]就是一种使用图神经网络检测垃圾评论发送者的方法。但是为了避免被算法检测，垃圾评论发送者可能会产生一些伪装行为，例如与大量正常用户建立正常交互，或者将自己的用户属性和发送的评论进行伪装，使其与正常的用户属性和评论相似。此时就需要对图神经网络的结构进行优化以适应存在伪装行为时的垃圾评论发送者检测任务。
[0005

【技术保护点】

【技术特征摘要】
1.一种在线社交网络垃圾评论用户检测方法，包括下列步骤：步骤一，图构建和预处理(1)以在线社交平台用户为节点，用户间的交互关系为边建立图结构，构建邻接矩阵；(2)将用户属性数值化，构建属性矩阵，属性矩阵每行代表对应的用户的属性；(3)人工标注部分数据，给出被标注的节点的编号及标签，1代表垃圾评论发送者，0代表正常用户，并划分训练集和测试集；(4)建立一个置信度向量其中N代表节点个数，第i位为0时代表节点i更可能为正常用户，第i位为1时代表节点i更可能为垃圾评论发送者；初始化该置信度向量，使训练集中标签为0的节点在B中对应的位置为0，使训练集中标签为1的节点在B中对应的位置为1，其余位置均为0；步骤二，图神经网络构建图神经网络共包含两层，最后一层的输出维度为2，第1维代表神经网络将节点判定为垃圾评论发送者的置信度，第2维代表神经网络将节点判定为正常用户的置信度，图神经网络通过聚合节点邻居的特征来获取节点自己的特征，在提取节点特征时考虑其邻居的类别信息，对于不同类型的邻居执行不同的特征聚合策略；对于每一层图神经网络均包含以下过程：(1)使用全连接层将用户u的特征h
u
降维得到降维后的用户特征z
u
，公式如下：z
u
＝W
t
h
u
其中，为全连接层的权重矩阵，d
in
为该层输入维度，d
out
为该层输出维度；(2)将节点v视为中心节点，对于节点v在关系r下的每一个邻居u，按照其与中心节点的关系计算其重要性系数公式如下：其中，为可训练的权重向量；(3)根据置信度向量B判断节点的邻居是否与其同类，将关系r下的节点v的同类邻居放到集合中，异类邻居放到集合中；(4)将两类邻居的重要性系数分别进行归一化操作，得到用以聚合的注意力分数；对于节点v在关系r下的邻居u，如果节点u与节点v同类，则其注意力分数由以下公式求得：其中，为节点v的同类邻居的集合；exp为自然指数函数；σ为非线性激活函数；同理，如果该邻居节点与节点v异类，则其注意力分数由以下公式求得：
其中，为节点v的异类邻居的集合；(5)根据上一步计算得到的注意力分数分别计算关系r下中心节点v的同类邻居的嵌入和中心节点v的异类邻居的嵌入其计算公式如...

【专利技术属性】
技术研发人员：杨泽，戴维迪，邵明来，李天鹏，
申请(专利权)人：天津大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人