异常交易数据的获取方法和装置制造方法及图纸

技术编号:16217232 阅读:40 留言:0更新日期:2017-09-15 23:30
本申请提出一种异常交易数据的获取方法和装置,其中,该异常交易数据的获取方法,包括以下步骤:获取目标产品的用户交易数据,其中,用户交易数据包括用户信息和交易编号;根据用户信息对用户进行群组划分,为每一群组对应生成群组标签;根据各群组标签对应的用户交易数据获取目标产品的用户分布信息;根据用户分布信息计算用户分布的信息熵,判断用户分布信息是否符合预设分布;如果用户分布信息不符合预设分布,则根据各群组标签对应的交易数据的数量筛选出一个或多个群组;以筛选出的群组及其交易数据作为异常交易群组及其异常交易数据。本申请的异常交易数据的获取方法,能够有效识别团伙作弊交易模式的异常交易,提高异常交易的召回率。

Method and device for obtaining abnormal transaction data

The invention provides a method and a device, to obtain an abnormal transaction data, gets the method of abnormal transaction data, which comprises the following steps: the user transaction data, obtain the target product which the user transaction data including user information and transaction number; according to the user information grouping for users, for each corresponding group group labels; according to the distribution of users information user transaction data for each group corresponding to the label of the acquisition target product; according to the user information entropy distribution user information distribution, to determine whether the user information distribution accord with the preset distribution; if the user does not meet the preset information distribution distribution, according to the number of transaction data for each group corresponding to the selected label one or more groups; groups in the screened and transaction data as the abnormal trading group and abnormal transaction number According to the. The method of obtaining abnormal transaction data can effectively identify abnormal transactions of the gang cheating transaction mode, and improve the recall rate of abnormal transactions.

【技术实现步骤摘要】
异常交易数据的获取方法和装置
本申请涉及互联网
,特别涉及一种异常交易数据的获取方法和装置。
技术介绍
随着互联网的飞速发展,电子商务在整个商业领域的地位越来越重要。互联网交易中虚假交易也越来越多,且升级为多个用户团伙作弊的特征等更加隐蔽的模式,这对整个电子商务平台产生了严重的负面影响。现有的异常交易的识别技术已较难适应如今变化多端的团伙作弊模式。目前可通过以下方法发现异常交易方法:1)收集大量异常交易数据作为识别正样本;2)结合业务知识设计相关识别特征;3)通过人工数据分析或机器学习分类算法挖掘相关模式与规则;4)根据挖掘的模式规则,从原始交易数据中发现异常交易。但是,上述方法需要人工判别数据,消耗的人力资源很多,尤其是在大数据背景下此问题尤为严重。其次,该方法需要结合大量的业务背景知识,针对不同业务场景设计不同的算法,得到的模型缺少可解释性。另外,对于团伙作弊的异常交易,由于其隐蔽性较高,因此基于交易表面特征的方法已经较难适应,召回率远不能满足现有业务场景的需求。
技术实现思路
本申请旨在至少在一定程度上解决上述技术问题。为此,本申请的第一个目的在于提出一种异常交易数据的获取方法,能够有效识别团伙作弊交易模式的异常交易,提高异常交易的召回率。本申请的第二个目的在于提出一种异常交易数据的获取装置。为达上述目的,根据本申请第一方面实施例提出了一种异常交易数据的获取方法,包括以下步骤:获取目标产品的用户交易数据,其中,所述用户交易数据包括用户信息和交易编号;根据所述用户信息对用户进行群组划分,为每一群组对应生成群组标签;根据各群组标签对应的用户交易数据获取所述目标产品的用户分布信息;根据所述用户分布信息计算用户分布的信息熵,判断所述用户分布信息是否符合预设分布;如果所述用户分布信息不符合所述预设分布,则根据各群组标签对应的交易数据的数量筛选出一个或多个群组;以所述筛选出的群组及其交易数据作为异常交易群组及其异常交易数据。本申请实施例的异常交易数据的获取方法,可根据交易数据中的用户信息生成群组标签,并根据群组标签对用户进行群组划分,并根据各群组对应的用户交易数据获取目标产品的用户分布信息,并在用户分布信息不符合预设分布时,根据各群组标签对应的交易数据的数量筛选出异常交易数据对应,能够有效识别团伙作弊交易模式的异常交易,提高异常交易的召回率。本申请第二方面实施例提供了一种异常交易数据的获取装置,包括:第一获取模块,用于获取目标产品的用户交易数据,其中,所述用户交易数据包括用户信息和交易编号;生成模块,用于根据所述用户信息对用户进行群组划分,为每一群组对应生成群组标签;第二获取模块,用于根据各群组标签对应的用户交易数据获取所述目标产品的用户分布信息;判断模块,用于根据所述用户分布信息计算用户分布的信息熵,判断所述用户分布信息是否符合预设分布;筛选模块,用于当所述用户分布信息不符合所述预设分布时,根据各群组标签对应的交易数据的数量筛选出一个或多个群组,并以所述筛选出的群组及其交易数据作为异常交易群组及其异常交易数据。本申请实施例的异常交易数据的获取装置,可根据交易数据中的用户信息生成群组标签,并根据群组标签对用户进行群组划分,并根据各群组对应的用户交易数据获取目标产品的用户分布信息,并在用户分布信息不符合预设分布时,根据各群组标签对应的交易数据的数量筛选出异常交易数据对应,能够有效识别团伙作弊交易模式的异常交易,提高异常交易的召回率。本申请的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。附图说明本申请的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:图1为根据本申请一个实施例的异常交易数据的获取方法的流程图;图2为根据本申请图1所示实施例中S104的流程图;图3为根据本申请一个实施例的根据用户分布信息计算用户分布的信息熵的方法流程图;图4为根据本申请一个实施例的拟合预估函数的流程图;图5为根据本申请另一个实施例的异常交易数据的获取方法的流程图;图6为根据本申请一个实施例的异常交易数据的获取架构图;图7为根据本申请一个实施例的异常交易数据的获取装置的结构示意图;图8为根据本申请另一个实施例的异常交易数据的获取装置的结构示意图。具体实施方式下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。下面参考附图描述根据本申请实施例的异常交易数据的获取方法和装置。图1为根据本申请一个实施例的异常交易数据的获取方法的流程图。如图1所示,根据本申请实施例的异常交易数据的获取方法,包括以下步骤。S101,获取目标产品的用户交易数据,其中,用户交易数据包括用户信息和交易编号。其中,用户交易数据可为用户在互联网购物平台上的交易。例如,可以是购物交易等。用户信息可包括买家的账户、姓名、收货地址、联系方式、社交关系、用户的硬件信息、IP(InternetProtocol,网络之间互连的协议)地址等。交易编号可为交易订单号等。举例来说,用户交易数据的数据格式可为:{交易ID,产品ID}。S102,根据用户信息对用户进行群组划分,为每一群组对应生成群组标签。其中,一个群组标签唯一标识一个用户群组。在本申请的一个实施例中,可针对目标产品收集大量用户交易数据,并根据用户交易数据中的用户信息生成群组标签。添加群组标签后用户交易数据的数据格式可为:{交易ID,产品ID,群组标签(GroupTag)}。在本申请的一个实施例中,可根据用户信息计算用户组群关系特征,并将用户组群关系特征作为群组标签。例如,可基于LPA(labelpropagationalgorithm,标签传播算法)、FNCA(fastnetworkclusteringalgorithm,快速社区挖掘算法)等社区发现算法从用户信息中生成群组标签。举例来说,通过社区发现算法挖掘出两个交易数据A和B中的用户为同一用户或者为属于同一社交圈M的用户,则可为交易数据A和B生成群组标签“M”。在本申请的另一个实施例中,如果用户信息为用户的硬件信息,则可根据用户的硬件信息生成群组标签。举例来说,如果两个交易数据C和D中用户的设备标识都是“N”,则可为交易数据C和D生成群组标签“N”。或者,可将用户的IP地址等信息直接作为群组标签。因此,可以看出,一个交易数据可具有一个或多个群组标签,一个群组标签中也可标记一个或多个交易数据中的用户群组信息。需要说明的是,由于一个买家可以属于多个用户群组,因此同一买家可以以多个用户群组的身份完成针对同一产品的交易,由于无法获知买家是以哪一个群组(一个用户群组对应一个群组标签)的身份参加的交易活动,因此同一个交易ID可以带有多个群组标签,即交易数据中存在交易ID相同,但是群组标签不同的数据。S103,根据各群组标签对应的用户交易数据获取目标产品的用户分布信息。其中,用户分布信息为用户对应的交易数据基于各个群组标签的分布情况。本申请的实施例中,可根据交易数据中各个群组标签中的数量以及交易编号与用户信息的对应关系本文档来自技高网...
异常交易数据的获取方法和装置

【技术保护点】
一种异常交易数据的获取方法,其特征在于,包括以下步骤:获取目标产品的用户交易数据,其中,所述用户交易数据包括用户信息和交易编号;根据所述用户信息对用户进行群组划分,为每一群组对应生成群组标签;根据各群组标签对应的用户交易数据获取所述目标产品的用户分布信息;根据所述用户分布信息计算用户分布的信息熵,判断所述用户分布信息是否符合预设分布;如果所述用户分布信息不符合所述预设分布,则根据各群组标签对应的交易数据的数量筛选出一个或多个群组;以所述筛选出的群组及其交易数据作为异常交易群组及其异常交易数据。

【技术特征摘要】
1.一种异常交易数据的获取方法,其特征在于,包括以下步骤:获取目标产品的用户交易数据,其中,所述用户交易数据包括用户信息和交易编号;根据所述用户信息对用户进行群组划分,为每一群组对应生成群组标签;根据各群组标签对应的用户交易数据获取所述目标产品的用户分布信息;根据所述用户分布信息计算用户分布的信息熵,判断所述用户分布信息是否符合预设分布;如果所述用户分布信息不符合所述预设分布,则根据各群组标签对应的交易数据的数量筛选出一个或多个群组;以所述筛选出的群组及其交易数据作为异常交易群组及其异常交易数据。2.如权利要求1所述的异常交易数据的获取方法,其特征在于,所述判断所述用户分布信息是否符合预设分布具体包括:获取所述目标产品对应的用户分布的基准信息熵;获取所述信息熵和所述基准信息熵之间差值;如果所述差值大于预设阈值,则判断所述用户分布信息不符合所述预设分布。3.如权利要求1所述的异常交易数据的获取方法,其特征在于,所述用户信息为所述用户的硬件信息,所述根据所述用户信息对用户进行群组划分,为每一群组对应生成群组标签具体包括:根据所述用户的硬件信息对用户进行群组划分,为每一群组对应生成群组标签。4.如权利要求1所述的异常交易数据的获取方法,其特征在于,所述根据所述用户信息生成群组标签具体包括:根据所述用户信息计算用户组群关系特征,根据所述群组关系特征对用户进行群组划分,并将所述用户组群关系特征作为对应用户群组的群组标签。5.如权利要求1所述的异常交易数据的获取方法,其特征在于,所述根据所述用户分布信息计算用户分布的信息熵具体包括:以所述群组标签为主键、所述交易编号为值对所述用户交易数据进行整理,以生成第一交易列表;以所述交易编号为主键、所述群组标签为值对所述用户交易数据进行整理,以生成第二交易列表;根据预设条件对所述第二交易列表中每个交易编号对应的群组标签进行压缩,以使所述第二交易列表中每个交易编号具有唯一对应的群组标签。以所述群组标签为主键、所述交易编号为值对压缩后的第二交易列表进行整理,以生成第三交易列表;获取各群组标签在所述第三交易列表中的出现概率,并根据所述出现概率计算所述用户分布的信息熵。6.如权利要求2所述的异常交易数据的获取方法,其特征在于,所述获取所述目标产品对应的用户分布的基准信息熵具体包括:获取所述目标产品对应的产品交易量;根据预先拟合的预估函数和所述产品交易量生成所述目标产品对应的用户分布的基准信息熵。7.如权利要求6所述的异常交易数据的获取方法,其特征在于,还包括:将所述异常交易数据从所述交易数据中删除,并更新所述产品交易量;根据更新后的产品交易量更新所述基准分布信息熵。8.如权利要求6所述的异常交易数据的获取方法,其特征在于,通过以下步骤拟合所述预估函数:获取所述目标产品的交易数据样本;根据所述交易数据样本分别获取所述目标产品在多个交易量下对应的用户分布的信息熵;构建基准信息熵拟合函数;根据所述多个交易量以及与所述多个交易量分别对应的用户分布的信息熵对所述基准信息熵拟合函数进行参数估计,以得到所述预估函数。9.如权利要求1-8任一项所述的异常...

【专利技术属性】
技术研发人员:董方徐嘉明
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1