System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于自适应多频谱滤波的图神经网络电商异常检测方法技术_技高网

基于自适应多频谱滤波的图神经网络电商异常检测方法技术

技术编号:39952931 阅读:8 留言:0更新日期:2024-01-08 23:26
本发明专利技术公开一种基于自适应多频谱滤波的图神经网络电商异常检测方法,获取用户评论内容特征和用户评论行为特征;将对同一商品构造用户‑评论图结构;基于伯恩斯坦多项式分别学习得到图的低通和高通滤波器,得到图中节点的低频和高频信号表示;基于固定的带通滤波器,得到图中节点的带通信号表示;使用注意力机制,融合得到的低通、带通、和高通信号,通过注意力损失函数,为每个节点自适应的学习出不同频率信号占该节点最终节点表示的比重;使用softmax层计算最终的节点表示,得到图神经网络模型的预测结果,并根据损失函数,计算节点的分类损失,更新模型参数。本发明专利技术缓解了以往的方法会导致的过平滑问题,提升了对电商交易网络中异常节点的识别率。

【技术实现步骤摘要】

本专利技术属于信息,具体涉及一种基于自适应多频谱滤波的图神经网络电商异常检测方法


技术介绍

1、随着互联网和电子商务的飞速发展,许多电商平台应运而生,由于网络购物的便捷性,人们也越来越依赖于通过电商平台购买商品。与线下购物不同的是,电商平台上的消费者无法真实的接触到商品,因此消费者往往通过综合其余消费者对相同商品的评价来综合考虑是否购买此商品。因此,商品评论的真实性对于消费者来说是至关重要的。然而,存在一些商家为了推销商品,会花钱雇佣网络水军来扰乱消费者对评论的判断。这些水军群组不依据客观事实对商品进行评分,而且数量众多,隐蔽性强,造成商品评价异常,从而导致消费者对商品价值的错误判断。因此如何能够识别那些有组织的恶意攻击用户,具有深刻的理论意义和重大的社会经济价值。

2、异常检测是一种数据挖掘过程,旨在识别偏离数据集中大多数的异常模式。为了检测异常,传统技术通常将真实世界的对象表示为特征向量(例如,在传统水军异常检测中,将电商平台中的用户的若干种行为或特征进行向量化),然后检测向量空间中的离群点,从而达到检测异常用户的效果。尽管这些技术在表格数据格式下定位偏离的数据点方面表现出了强大的能力,但它们本质上放弃了对象之间的复杂关系。

3、在现实中,许多对象彼此之间具有丰富的关系,这可以为异常检测提供有价值的补充信息。在电商平台中,水军用户可以使用正常用户的有效信息创建,也可以通过模仿良性用户的属性来伪装自己。在这种情况下,水军用户和良性用户将具有几乎相同的特征,因此传统的异常检测技术无法仅使用特征信息来准确且高效识别他们。同时,异常用户总是与大量良性用户建立关系,以增加他们的声誉和影响力,从而获得意想不到的利益。因此,更全面的异常检测技术应该考虑这些用户之间连接的结构信息,以更好的辅助识别异常用户。

4、图这种数据结构已广泛用于一系列应用领域,包括社交网络、电子商务、生物医学和通信网络等。利用图中包含的结构信息,检测图中的异常在非欧几里得空间中提出了一个更复杂的异常检测问题——图异常检测(gad),旨在识别图中的反常图对象(即节点、边或子图。随着深度学习技术的迅速发展,图形神经网络(gnn)得以诞生和快速发展。gnn的核心是通过将节点特征传递给相邻节点来操作图结构上的各种聚合函数;每个节点聚集其邻居的特征向量,以计算和更新其新的特征向量。电子商务中的水军异常检测问题可以看成是图上的节点分类问题(图中的节点表示用户/评论,图中的边表示用户/评论之间的关系)。利用gnn来检测非欧几里得数据中的异常逐渐成为一种有效且常用的手段。

5、基于gnn的异常检测的一般直觉是利用gnn的表达能力来学习节点表示,旨在将异常节点与嵌入空间中的正常节点区分开来。然而,最近的一些研究表明,大多数gnn模型(如gcn,图卷积神经网络)的表达能力仅限于低通滤波器,此类gnn模型通常增强低频信号(更平滑的信号),抑制高频信号(更多的振荡信号)。gnn作为低通滤波器的性质在现实世界中的许多任务上有效,因为大多数现实世界的网络都遵循同质性假设,即具有相似特征的节点往往相互连接。然而,这一假设在包含局部异常的网络中可能会不成立:正常节点仍然倾向于与其正常邻居(低频信号)共享共同特征,而异常节点往往与邻居节点具有不同的特征(高频信号)。因此,包含异常的网络倾向于混合高频和低频信号。目前,一些现存的工作利用了图中低频和高频信号做图中的异常检测,但是这些工作忽视了图中中频信号的作用,中频信号作为图中信号频段中不可缺少的一部分不应该被忽视,中频信号的引入可以增强图神经网络模型的表达能力,所以我们需要的是能自适应融合低频、中频和高频的图谱滤波的异常检测模型。


技术实现思路

1、专利技术目的:本专利技术提供一种基于自适应多频谱滤波的图神经网络电商异常检测方法,能够缓解传统gnn在面对异常任务中的低通特性,提高对欺诈者的识别精度。

2、技术方案:本专利技术所述的一种基于自适应多频谱滤波的图神经网络电商异常检测方法,具体包括以下步骤:

3、(1)基于电商平台的交易日志数据,获取用户评论内容特征和用户评论行为特征;

4、(2)人工标记少量的高度怀疑欺诈用户和普通用户,得到异常和正常两类样本的标签数据,用于图神经网络模型的训练;

5、(3)将对同一商品进行评价的用户构造边,构造用户-评论图结构,用来表达用户的评论特点和用户之间的关系;

6、(4)使用基于伯恩斯坦多项式分别学习得到图的低通和高通滤波器,得到图中节点的低频和高频信号表示;使用基于固定的带通滤波器,得到图中节点的中频信号表示;

7、(5)使用注意力机制,融合步骤(4)得到的低频、中频和高频信号;通过注意力损失函数,为每个节点自适应的学习出不同频率信号占该节点最终节点表示的比重;

8、(6)使用softmax层计算步骤(5)得到的最终的节点表示,得到最终的图神经网络模型的预测结果,并根据损失函数,计算节点的分类损失;

9、(7)根据评价指标衡量当前的图神经网络模型的效果,保存相关评价指标;利用步骤(5)得到的注意力损失,和步骤(6)得到的分类损失相加得到模型最终的损失,使用反向传播更新图神经网络模型参数;

10、(8)重复步骤(5)至(7),得到多个训练好的图神经网络模型,根据评价指标选择最优的图神经网络模型。

11、进一步地,步骤(1)所述用户评论内容特征包括相似评论的数量、评论中特殊符号的数量、评论的长度、评论的星级、特殊符号占评论的占比;所述用户评论行为特征包括指定时间内评论的数量、评论的时间分布、评论的评分分布。

12、进一步地,步骤(2)所述图神经网络模型包括节点特征变换,节点特征信号滤波,以及节点类别判断。

13、进一步地,所述步骤(3)实现过程如下:

14、(31)将用户表示为图中的节点;

15、(32)如果两个用户节点之间存在对相同商品的评论行为,则在该对节点间添加一条边,得到图g={v,a,x};根据步骤(2)得到的人工标记的异常和正常样本的标签得到节点的标签向量y;

16、其中,v={v1,v2,v3,…,vn}表示图中的节点集合,每个节点vi∈v都有一个对应的特征向量xi∈rd×1,x=[x1,x2,x3,…,xn]t即表示特征矩阵;a∈rn×n表示的是图的邻接矩阵,其中ai,j=1表示的是节点vi与节点vj之间有一条边相连,没有边相连则ai,j=0;y∈rn是一个指示向量,表示节点是否为异常节点,若vi是异常节点,则yi=1,否则yi=0。

17、进一步地,所述步骤(4)实现过程如下:

18、(41)学习得到低通和高通滤波器,根据图信号处理与图傅里叶变换理论,滤波器过滤的图信号zk定义如下:

19、zk=ugk(λ)utx=udiag[gk(λ1),…,gk(λn)]utx

20、其中,u和ut分别表示对称归一化的图拉普拉斯矩阵本文档来自技高网...

【技术保护点】

1.一种基于自适应多频谱滤波的图神经网络电商异常检测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于自适应多频谱滤波的图神经网络电商异常检测方法,其特征在于,步骤(1)所述用户评论内容特征包括相似评论的数量、评论中特殊符号的数量、评论的长度、评论的星级、特殊符号占评论的占比;所述用户评论行为特征包括指定时间内评论的数量、评论的时间分布、评论的评分分布。

3.根据权利要求1所述的基于自适应多频谱滤波的图神经网络电商异常检测方法,其特征在于,步骤(2)所述图神经网络模型包括节点特征变换,节点特征信号滤波,以及节点类别判断。

4.根据权利要求1所述的基于自适应多频谱滤波的图神经网络电商异常检测方法,其特征在于,所述步骤(3)实现过程如下:

5.根据权利要求1所述的基于自适应多频谱滤波的图神经网络电商异常检测方法,其特征在于,所述步骤(4)实现过程如下:

6.根据权利要求1所述的基于自适应多频谱滤波的图神经网络电商异常检测方法,其特征在于,所述步骤(5)实现过程如下:

7.根据权利要求1所述的基于自适应多频谱滤波的图神经网络电商异常检测方法,其特征在于,所述步骤(6)的实现过程如下:

8.根据权利要求3所述的基于自适应多频谱滤波的图神经网络电商异常检测方法,其特征在于,所述节点特征变换是使用节点特征X经过全连接神经网络作特征维度变换,将原始的特征维度变换到更高维度,计算公式如下:

...

【技术特征摘要】

1.一种基于自适应多频谱滤波的图神经网络电商异常检测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于自适应多频谱滤波的图神经网络电商异常检测方法,其特征在于,步骤(1)所述用户评论内容特征包括相似评论的数量、评论中特殊符号的数量、评论的长度、评论的星级、特殊符号占评论的占比;所述用户评论行为特征包括指定时间内评论的数量、评论的时间分布、评论的评分分布。

3.根据权利要求1所述的基于自适应多频谱滤波的图神经网络电商异常检测方法,其特征在于,步骤(2)所述图神经网络模型包括节点特征变换,节点特征信号滤波,以及节点类别判断。

4.根据权利要求1所述的基于自适应多频谱滤波的图神经网络电商异常检测...

【专利技术属性】
技术研发人员:孙宏亮许品曹杰张志旺陶海成朱桂祥
申请(专利权)人:南京财经大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1