一种虚假交易识别方法、装置及电子设备制造方法及图纸

技术编号:24687583 阅读:55 留言:0更新日期:2020-06-27 09:07
本说明书实施例提供一种虚假交易识别方法、装置及电子设备。所述方法包括:获取预定平台所对应的原始交易图数据,根据目标节点从所述原始交易图数据中提取出子图数据;将所述子图数据作为输入,利用预定的多个连续的神经网络结构执行信息聚合操作和特征向量提取操作得到目标特征向量;其中,所述信息聚合操作用于根据各节点之间的相关性确定注意力矩阵,并根据所述注意力矩阵对目标节点的邻域节点信息进行聚合,所述各节点之间的相关性包括根据各节点信息所确定的第一相关性以及根据边信息所确定的第二相关性;将所述目标特征向量输入到分类器中,以便根据所述分类器的输出结果判断所述待识别交易是否为虚假交易。

A false transaction identification method, device and electronic equipment

【技术实现步骤摘要】
一种虚假交易识别方法、装置及电子设备
本说明书涉及互联网
,尤其涉及一种虚假交易识别方法、装置及电子设备。
技术介绍
随着互联网技术的发展,依托互联网技术的电子商务平台也日趋成熟,在电商平台的市场交易过程中,一些商家为了提高自身的平台信用或者商品销量,会使用一些不正当的方式进行大量交易,这样的交易行为会被定性为虚假交易。虚假交易的买家往往不存在真实的购买意向,而卖家则通过第三方机构或者亲朋好友来完成商品出售,达到提高平台信用或商品销量的目的。虚假交易的存在虽然提高了电商平台的销售额,但从长远来看会对平台的信誉造成影响,会有越来越多的买家对商品的购买量、评价、卖家信用等产生怀疑,因此,虚假交易的识别对电商平台来说是十分必要的。为了判断交易是否为虚假交易,在现有的虚假交易识别技术中,通常使用逻辑回归和梯度提升决策树的算法,然而,逻辑回归算法模型过于简单,对于复杂分类问题的预测能力有限,梯度提升决策树无法直接应用于图数据处理,且需要依赖于人工特征工程。因此,基于现有技术,需要提供一种能够应用于图数据处理,有效解决复杂分类问题,减少对人工特征工程依赖,且提升识别速度和识别效果的虚假交易识别方案。
技术实现思路
本说明书实施例提供一种虚假交易识别方法、装置及电子设备,以解决现有技术存在的无法消费使用图数据、需要依赖于人工特征工程、识别速度慢、识别效果差的问题。为解决上述技术问题,本说明书实施例是这样实现的:本说明书实施例提供的一种虚假交易识别方法,所述方法包括:获取预定平台所对应的原始交易图数据,根据目标节点从所述原始交易图数据中提取出子图数据,其中,所述目标节点包括根据待识别交易所确定的买家节点及卖家节点;将所述子图数据作为输入,利用预定的多个连续的神经网络结构执行信息聚合操作和特征向量提取操作得到目标特征向量;其中,所述信息聚合操作用于根据各节点之间的相关性确定注意力矩阵,并根据所述注意力矩阵对目标节点的邻域节点信息进行聚合,所述各节点之间的相关性包括根据各节点信息所确定的第一相关性以及根据边信息所确定的第二相关性;将所述目标特征向量输入到分类器中,以便根据所述分类器的输出结果判断所述待识别交易是否为虚假交易。本说明书实施例提供的一种虚假交易识别装置,所述装置包括:获取模块,用于获取预定平台所对应的原始交易图数据,根据目标节点从所述原始交易图数据中提取出子图数据,其中,所述目标节点包括根据待识别交易所确定的买家节点及卖家节点;神经网络模块,用于将所述子图数据作为输入,利用预定的多个连续的神经网络结构执行信息聚合操作和特征向量提取操作得到目标特征向量;其中,所述信息聚合操作用于根据各节点之间的相关性确定注意力矩阵,并根据所述注意力矩阵对目标节点的邻域节点信息进行聚合,所述各节点之间的相关性包括根据各节点信息所确定的第一相关性以及根据边信息所确定的第二相关性;判断模块,用于将所述目标特征向量输入到分类器中,以便根据所述分类器的输出结果判断所述待识别交易是否为虚假交易。本说明书实施例提供的一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述一种虚假交易识别方法。本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:通过获取预定平台所对应的原始交易图数据,根据目标节点从原始交易图数据中提取出子图数据;将子图数据作为输入,利用预定的多个连续的神经网络结构执行信息聚合操作和特征向量提取操作得到目标特征向量;其中,信息聚合操作用于根据各节点之间的相关性确定注意力矩阵,并根据注意力矩阵对目标节点的邻域节点信息进行聚合,各节点之间的相关性包括根据各节点信息所确定的第一相关性以及根据边信息所确定的第二相关性;将目标特征向量输入到分类器中,以便根据分类器的输出结果判断待识别交易是否为虚假交易。基于本方案,能有效利用子图数据中所有买家节点、卖家节点以及边上的特征,通过聚合邻域节点的信息,同时考虑目标节点自身的属性信息及其在图中的上下文信息,更好的描述了买家和卖家之间是否存在真实可匹配的交易关系,能有效的解决复杂分类问题,极大减轻模型对人工特征工程的依赖,提升了虚假交易识别的速度及识别效果。附图说明为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本说明书实施例提供的一种虚假交易识别方法的流程示意图;图2为本说明书实施例提供的一种原始交易二部图的结构示意图;图3为本说明书实施例提供的一种融合边信息的图注意力神经网络的结构示意图;图4为本说明书实施例提供的一种虚假交易识别装置的结构示意图。具体实施方式为了使本
的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。虚假交易识别技术对于电商平台的必要性可归纳为以下两点:(1)对于非虚假交易的商户,当交易发生时,直接对其放行而不进行深度风险识别,这种方式可以极大减少服务器端的识别压力,减少云端成本;(2)对于虚假交易的商户,当交易发生时,对该交易进行处置,并对虚假交易率过高的商家信用进行处罚,增加商户虚假交易的成本。为了判断一笔交易是否为虚假交易,现有的虚假交易识别技术主要使用逻辑回归和梯度提升决策树这两种算法,下面对这两种算法分别进行介绍并说明其存在的缺点:(1)逻辑回归是一种广义的线性回归模型,常用于数据挖掘、经济预测等领域。逻辑回归假设因变量服从伯努利分布,因此可解决二分类问题,用来估计某种事物的可能性。通过逻辑回归分析,可以得到自变量的权重,从而了解不同因素对分类结果产生影响的重要性。但逻辑回归模型过于简单,对于复杂分类问题的预测能力有限。(2)梯度提升决策树是由多棵决策树组成的集成学习算法,所有树的结论累加起来作为最终预测结果。其思想是对于给定数据集,通过训练多个弱学习器,以一定的结合策略形成一个强学习器,达到博采众长的目的。但是,梯度提升决策树无法直接应用于图数据相关问题,其次,梯度提升决策树十分依赖人工特征工程。针对现有的虚假交易识别技术,为了实现能够应用于图数据处理,有效解决复杂分类问题,减少对人工特征工程的依赖,进一步提升虚假交易识别的速度和识别效果。因此为达到以上目的,需要提供了一种基于新的神经网络模型的虚假交易识别方法。图1为本说明书实施例提供的一种虚假交易识别方法的流程示意图,该方法具体可以包括以下步骤:在步骤S1本文档来自技高网
...

【技术保护点】
1.一种虚假交易识别方法,所述方法包括:/n获取预定平台所对应的原始交易图数据,根据目标节点从所述原始交易图数据中提取出子图数据,其中,所述目标节点包括根据待识别交易所确定的买家节点及卖家节点;/n将所述子图数据作为输入,利用预定的多个连续的神经网络结构执行信息聚合操作和特征向量提取操作得到目标特征向量;其中,所述信息聚合操作用于根据各节点之间的相关性确定注意力矩阵,并根据所述注意力矩阵对目标节点的邻域节点信息进行聚合,所述各节点之间的相关性包括根据各节点信息所确定的第一相关性以及根据边信息所确定的第二相关性;/n将所述目标特征向量输入到分类器中,以便根据所述分类器的输出结果判断所述待识别交易是否为虚假交易。/n

【技术特征摘要】
1.一种虚假交易识别方法,所述方法包括:
获取预定平台所对应的原始交易图数据,根据目标节点从所述原始交易图数据中提取出子图数据,其中,所述目标节点包括根据待识别交易所确定的买家节点及卖家节点;
将所述子图数据作为输入,利用预定的多个连续的神经网络结构执行信息聚合操作和特征向量提取操作得到目标特征向量;其中,所述信息聚合操作用于根据各节点之间的相关性确定注意力矩阵,并根据所述注意力矩阵对目标节点的邻域节点信息进行聚合,所述各节点之间的相关性包括根据各节点信息所确定的第一相关性以及根据边信息所确定的第二相关性;
将所述目标特征向量输入到分类器中,以便根据所述分类器的输出结果判断所述待识别交易是否为虚假交易。


2.如权利要求1所述的方法,所述预定平台包括电商平台,所述获取预定平台所对应的原始交易图数据,包括:
获取所述电商平台所产生的历史交易数据,根据所述历史交易数据创建所述原始交易图数据,所述原始交易图数据中包含由节点信息组成的节点集合,以及由边信息组成的边集合。


3.如权利要求1所述的方法,所述根据目标节点从所述原始交易图数据中提取出子图数据,包括:
利用图采样算法从所述原始交易图数据中将所述买家节点、卖家节点以及其分别对应的二度邻居节点提取出来构成节点子集,将两端节点均在所述节点子集内的边从所述原始交易图数据中提取出来构成边子集,利用所述节点子集和边子集构成所述子图数据。


4.如权利要求1所述的方法,在所述执行信息聚合操作之前,还包括:
利用所述子图数据中的节点信息所对应的向量构成节点向量矩阵,并利用邻接矩阵对所述子图数据中的边信息进行处理得到张量,将所述节点向量矩阵以及张量作为多头注意力机制的输入。


5.如权利要求4所述的方法,所述根据各节点之间的相关性确定注意力矩阵,包括:
对所述节点向量矩阵中的节点向量进行线性变换,以便将其转换为查询向量、主键向量和值向量,将任意节点的查询向量与其他节点的主键向量进行点积运算,所述点积运算的结果用于表示所述第一相关性;
对所述张量中的多个矩阵与预定的系数执行加权操作,所述加权操作的结果用于表示所述第二相关性;
根据所述第一相关性和第二相关性确定注意力矩阵。


6.如权利要求5所述的方法,采用以下计算式执行所述根据各节点之间的相关性确定注意力矩阵的操作,具体地:



其中,表示注意力矩阵;表示查询向量;表示主键向量;表示值向量;表示边信息;表示第一相关性的矩阵;表示张量的第k个矩阵分量;表示第二相关性的矩阵;表示节点间综合相关性的矩阵。


7.如权利要求5所述的方法,所述根据所述注意力矩阵对目标节点的邻域节点信息进行聚合,包括:
利用所述注意力矩阵对所述目标节点的邻域节点所对应的值向量进行加权求和,以便聚合所述邻域节点信息。


8.如权利要求7所述的方法,采用以下计算式执行所述根据所述注意力矩阵对目标节点的邻域节点信息进行聚合的操作,具体地:



其中,表示注意力矩阵,注意力矩阵中的每一行表示一组归一化权重;表示不同节点的值向量;表示对任一目标节点,注意力矩阵中对应该目标节点的一行表示其对应的所有邻域节点,并将邻域节点的值向量进行加权求和。


9.如权利要求1所述的方法,每个所述神经网络结构内包含串联而成的多头注意力机制、第一归一化层、前馈网络和第二归一化层;其中,所述多头注意力机制用于执行所述信息...

【专利技术属性】
技术研发人员:吕乐肖凯周璟陆毅成宝鹏庆赵闻飙王维强
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1