The invention provides a method and a device, to obtain an abnormal transaction data, gets the method of abnormal transaction data, which comprises the following steps: the user transaction data, obtain the target product which the user transaction data including user information and transaction number; according to the user information grouping for users, for each corresponding group group labels; according to the distribution of users information user transaction data for each group corresponding to the label of the acquisition target product; according to the user information entropy distribution user information distribution, to determine whether the user information distribution accord with the preset distribution; if the user does not meet the preset information distribution distribution, according to the number of transaction data for each group corresponding to the selected label one or more groups; groups in the screened and transaction data as the abnormal trading group and abnormal transaction number According to the. The method of obtaining abnormal transaction data can effectively identify abnormal transactions of the gang cheating transaction mode, and improve the recall rate of abnormal transactions.
【技术实现步骤摘要】
异常交易数据的获取方法和装置
本申请涉及互联网
,特别涉及一种异常交易数据的获取方法和装置。
技术介绍
随着互联网的飞速发展,电子商务在整个商业领域的地位越来越重要。互联网交易中虚假交易也越来越多,且升级为多个用户团伙作弊的特征等更加隐蔽的模式,这对整个电子商务平台产生了严重的负面影响。现有的异常交易的识别技术已较难适应如今变化多端的团伙作弊模式。目前可通过以下方法发现异常交易方法:1)收集大量异常交易数据作为识别正样本;2)结合业务知识设计相关识别特征;3)通过人工数据分析或机器学习分类算法挖掘相关模式与规则;4)根据挖掘的模式规则,从原始交易数据中发现异常交易。但是,上述方法需要人工判别数据,消耗的人力资源很多,尤其是在大数据背景下此问题尤为严重。其次,该方法需要结合大量的业务背景知识,针对不同业务场景设计不同的算法,得到的模型缺少可解释性。另外,对于团伙作弊的异常交易,由于其隐蔽性较高,因此基于交易表面特征的方法已经较难适应,召回率远不能满足现有业务场景的需求。
技术实现思路
本申请旨在至少在一定程度上解决上述技术问题。为此,本申请的第一个目的在于提出一种异常交易数据的获取方法,能够有效识别团伙作弊交易模式的异常交易,提高异常交易的召回率。本申请的第二个目的在于提出一种异常交易数据的获取装置。为达上述目的,根据本申请第一方面实施例提出了一种异常交易数据的获取方法,包括以下步骤:获取目标产品的用户交易数据,其中,所述用户交易数据包括用户信息和交易编号;根据所述用户信息对用户进行群组划分,为每一群组对应生成群组标签;根据各群组标签对应的用户交易数据获取 ...
【技术保护点】
一种异常交易数据的获取方法,其特征在于,包括以下步骤:获取目标产品的用户交易数据,其中,所述用户交易数据包括用户信息和交易编号;根据所述用户信息对用户进行群组划分,为每一群组对应生成群组标签;根据各群组标签对应的用户交易数据获取所述目标产品的用户分布信息;根据所述用户分布信息计算用户分布的信息熵,判断所述用户分布信息是否符合预设分布;如果所述用户分布信息不符合所述预设分布,则根据各群组标签对应的交易数据的数量筛选出一个或多个群组;以所述筛选出的群组及其交易数据作为异常交易群组及其异常交易数据。
【技术特征摘要】
1.一种异常交易数据的获取方法,其特征在于,包括以下步骤:获取目标产品的用户交易数据,其中,所述用户交易数据包括用户信息和交易编号;根据所述用户信息对用户进行群组划分,为每一群组对应生成群组标签;根据各群组标签对应的用户交易数据获取所述目标产品的用户分布信息;根据所述用户分布信息计算用户分布的信息熵,判断所述用户分布信息是否符合预设分布;如果所述用户分布信息不符合所述预设分布,则根据各群组标签对应的交易数据的数量筛选出一个或多个群组;以所述筛选出的群组及其交易数据作为异常交易群组及其异常交易数据。2.如权利要求1所述的异常交易数据的获取方法,其特征在于,所述判断所述用户分布信息是否符合预设分布具体包括:获取所述目标产品对应的用户分布的基准信息熵;获取所述信息熵和所述基准信息熵之间差值;如果所述差值大于预设阈值,则判断所述用户分布信息不符合所述预设分布。3.如权利要求1所述的异常交易数据的获取方法,其特征在于,所述用户信息为所述用户的硬件信息,所述根据所述用户信息对用户进行群组划分,为每一群组对应生成群组标签具体包括:根据所述用户的硬件信息对用户进行群组划分,为每一群组对应生成群组标签。4.如权利要求1所述的异常交易数据的获取方法,其特征在于,所述根据所述用户信息生成群组标签具体包括:根据所述用户信息计算用户组群关系特征,根据所述群组关系特征对用户进行群组划分,并将所述用户组群关系特征作为对应用户群组的群组标签。5.如权利要求1所述的异常交易数据的获取方法,其特征在于,所述根据所述用户分布信息计算用户分布的信息熵具体包括:以所述群组标签为主键、所述交易编号为值对所述用户交易数据进行整理,以生成第一交易列表;以所述交易编号为主键、所述群组标签为值对所述用户交易数据进行整理,以生成第二交易列表;根据预设条件对所述第二交易列表中每个交易编号对应的群组标签进行压缩,以使所述第二交易列表中每个交易编号具有唯一对应的群组标签。以所述群组标签为主键、所述交易编号为值对压缩后的第二交易列表进行整理,以生成第三交易列表;获取各群组标签在所述第三交易列表中的出现概率,并根据所述出现概率计算所述用户分布的信息熵。6.如权利要求2所述的异常交易数据的获取方法,其特征在于,所述获取所述目标产品对应的用户分布的基准信息熵具体包括:获取所述目标产品对应的产品交易量;根据预先拟合的预估函数和所述产品交易量生成所述目标产品对应的用户分布的基准信息熵。7.如权利要求6所述的异常交易数据的获取方法,其特征在于,还包括:将所述异常交易数据从所述交易数据中删除,并更新所述产品交易量;根据更新后的产品交易量更新所述基准分布信息熵。8.如权利要求6所述的异常交易数据的获取方法,其特征在于,通过以下步骤拟合所述预估函数:获取所述目标产品的交易数据样本;根据所述交易数据样本分别获取所述目标产品在多个交易量下对应的用户分布的信息熵;构建基准信息熵拟合函数;根据所述多个交易量以及与所述多个交易量分别对应的用户分布的信息熵对所述基准信息熵拟合函数进行参数估计,以得到所述预估函数。9.如权利要求1-8任一项所述的异常...
【专利技术属性】
技术研发人员:董方,徐嘉明,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。