一种电商行业作弊行为的检测方法及装置制造方法及图纸

技术编号:15792717 阅读:61 留言:0更新日期:2017-07-10 01:45
本发明专利技术实施例公开了一种电商行业作弊行为的检测方法,所述方法包括:接收用户分析请求,以待分析用户终端的标识信息为索引,提取出待分析用户终端在检测时段内产生的XDR数据;从XDR数据中获得待分析用户终端的位置信息以及操作属性统计量;按照待分析用户终端之间的位置信息和操作属性统计量的相似性,将待分析用户终端划分为若干用户终端群组;从同一用户终端群组中各用户终端的XDR数据中获得各用户终端的操作行为;将同一用户终端群组按照操作行为的相似性划分为若干用户终端子分组;将操作行为的相似性大于预设阈值的用户终端子分组内的用户终端确定为作弊用户终端。本发明专利技术实施例还公开了一种电商行业作弊行为的检测装置。

【技术实现步骤摘要】
一种电商行业作弊行为的检测方法及装置
本专利技术涉及数据分析领域,尤其涉及一种电商行业作弊行为的检测方法及装置。
技术介绍
近年来随着通信网络和互联网平台的进一步发展,电子商务蓬勃发展,在线离线(OnlineToOffline,O2O)业务渗透到用户生活的方方面面。随之产生了一系列专门针对电子商务业务的欺诈、作弊行为,如各电商公司为了应对竞争,分别推出了一系列补贴、奖励政策;而投机分子采用刷单的手段利用假订单骗取补贴;或者,各网店为了提高曝光度和级别,雇佣一部分投机分子通过作弊方式进行销售量造假,或提高评价值。以上两种行为严重影响电商企业的正常运转,相应的电商企业也产生了一系列针对这些恶意行为的监控方法。现有技术主要采用以下两种方法来监控用户和商家的作弊行为。一种方法是规则匹配,即利用简单的规则匹配方式,发现可疑交易。例如设定为满足规则:买卖双方在短期内发生多次交易,或者出发点过于接近的用户和司机之间等等,则认为交易可疑。另一种方法是增强监控,通过采集更多的与业务相关的信息,来确认交易是否发生,或者是否正当。例如安装特定的客户端在“用车订单”执行过程中监控车辆全球定位系统(GlobalPositioningSystem,GPS)信息,并且采集基站、无线宽带(WiFi)、蓝牙等其他可用于定位的信息,来判断叫车订单是否按照预期执行,或者检测司机是否使用了虚假的GPS信息等。针对上述的监控方法,投机分子可以采用工程机变化身份,利用作弊机器修改设备串号等信息的能力,投机分子可能经常修改身份;或者,投机分子可以利用软件编程的方式来模拟普通用户的使用习惯,确保作弊机器的行为都趋于模拟正常操作。由于投机分子采用假冒数据、变换身份的方式实施作弊,单一电商企业依靠自己的数据难以全面监控这些行为。而且,由于相关的SIM卡和工程机的廉价化,专业性的刷单、作弊行为有大规模化的趋势。投机分子可以利用大量SIM卡进行刷单等处理,并且每台作弊机器上能够运行的程序都会尝试模拟用户的正常行为。这种集团化的、大规模的恶意作弊行为对电商的正常商业行为影响巨大,但是当前流行的作弊检测方法主要针对用户具体的操作信息进行跟踪、分析,只对投机分子的单次行为或者较明显的异常进行监控,难以发现这些刻意的、模拟正常操作的、多变的、集群的作弊行为。
技术实现思路
有鉴于此,本专利技术实施例期望提供一种电商行业作弊行为的检测方法及装置,可以有效检测到投机分子的作弊行为,提高了检测结果的准确性。为达到上述目的,本专利技术的技术方案是这样实现的:一种电商行业作弊行为的检测方法,所述方法包括:接收用户分析请求,所述用户分析请求中包括检测时段以及各个待分析用户终端的标识信息;以所述待分析用户终端的标识信息为索引,提取出所述待分析用户终端在所述检测时段内产生的X数据记录XDR数据;从所述待分析用户终端产生的所述XDR数据中获得所述待分析用户终端的位置信息以及操作属性统计量;按照所述待分析用户终端之间的位置信息和操作属性的相似性,将所述待分析用户终端划分为若干用户终端群组;从同一用户终端群组中各用户终端的XDR数据中获得各用户终端的操作行为;将所述同一用户终端群组按照操作行为的相似性划分为若干用户终端子分组;将操作行为的相似性大于预设阈值的用户终端子分组内的用户终端确定为作弊用户终端。上述方案中,所述从所述待分析用户终端产生的所述XDR数据中获得所述待分析用户终端的位置信息包括:根据所述XDR数据中记录的基站的位置信息,计算获得所述待分析用户终端的位置信息;或者,从所述XDR数据中提取所述待分析用户终端的位置信息。上述方案中,所述从所述XDR数据中提取所述待分析用户终端的位置信息,包括:在所述XDR数据中的网络接口与预存的对应关系表中的网络接口匹配上时,从所述XDR数据中匹配上的网络接口对应的位置字段处提取出所述待分析用户终端的位置信息,所述对应关系表中包括网络接口和位置字段的对应关系。上述方案中,所述按照所述待分析用户终端之间的位置信息和操作属性的相似性,将所述待分析用户终端划分为若干用户终端群组,包括:由所述待分析用户终端的位置信息、操作属性统计量构成待分析用户终端的特征向量,计算各待分析用户终端的特征向量之间的加权距离,其中,待分析用户终端的位置信息的权重大于操作属性统计量的权重;根据所述各待分析用户终端的特征向量之间的加权距离采用聚类算法,通过多次迭代将所述待分析用户终端聚类划分为若干用户终端群组。上述方案中,所述从同一用户终端群组中各用户终端的XDR数据中获得各用户终端的操作行为;将所述同一用户终端群组按照操作行为的相似性划分为若干用户终端子分组;将操作行为的相似性大于预设阈值的用户终端子分组内的用户终端确定为作弊用户终端,包括:从同一用户终端群组中各用户终端的XDR数据中获得各用户终端的操作时间和操作类型;将各用户终端的操作时间和操作类型进行编码获得各用户终端的操作时间序列码;计算同一用户终端群组内各个用户终端之间的操作时间序列码的闵可夫斯基距离;根据所述同一用户终端群组内各个用户终端之间的闵可夫斯基距离,采用聚类算法,通过多次迭代将所述同一用户终端群组聚类划分成若干用户终端子分组;计算所述用户终端子分组内各用户终端之间的闵可夫斯基距离的均值和方差;在所述均值小于预设第一阈值且所述方差小于预设第二阈值时,确定所述用户终端子分组内的用户终端确定为作弊用户终端。一种电商行业作弊行为的检测装置,所述检测装置包括:接收单元,用于接收用户分析请求,所述用户分析请求中包括检测时段以及各个待分析用户终端的标识信息;提取单元,用于以所述接收单元接收到的待分析用户终端的标识信息为索引,提取出所述待分析用户终端在所述检测时段内产生的X数据记录XDR数据;获取单元,用于从所述提取单元提取的所述待分析用户终端产生的所述XDR数据中获得所述待分析用户终端的位置信息以及操作属性统计量;划分单元,用于按照所述获取单元获取的所述待分析用户终端的位置信息和操作属性统计量的相似性,将所述待分析用户终端划分为若干用户终端群组;确定单元,用于从所述划分单元划分的同一用户终端群组中各用户终端的XDR数据中获得各用户终端的操作行为;将所述同一用户终端群组按照操作行为的相似性划分为若干用户终端子分组;将操作行为的相似性大于预设阈值的用户终端子分组内的用户终端确定为作弊用户终端。上述方案中,所述获取单元,具体用于根据所述提取单元提取的所述XDR数据中记录的基站的位置信息,计算获得所述待分析用户终端的位置信息;或者,从所述提取单元提取的所述XDR数据中提取所述待分析用户终端的位置信息。上述方案中,所述获取单元,具体用于在所述XDR数据中的网络接口与预存的对应关系表中的网络接口匹配上时,从所述XDR数据中匹配上的网络接口对应的位置字段处提取出所述待分析用户终端的位置信息,所述对应关系表中包括网络接口和位置字段的对应关系。上述方案中,所述划分单元,具体用于由所述获取单元获取的待分析用户终端的位置信息、操作属性统计量构成待分析用户终端的特征向量,计算各待分析用户终端的特征向量之间的加权距离,其中,待分析用户终端的位置信息的权重大于操作属性统计量的权重;根据所述各待分析用户终端的特征向量之间本文档来自技高网
...
一种电商行业作弊行为的检测方法及装置

【技术保护点】
一种电商行业作弊行为的检测方法,其特征在于,所述方法包括:接收用户分析请求,所述用户分析请求中包括检测时段以及各个待分析用户终端的标识信息;以所述待分析用户终端的标识信息为索引,提取出所述待分析用户终端在所述检测时段内产生的X数据记录XDR数据;从所述待分析用户终端产生的所述XDR数据中获得所述待分析用户终端的位置信息以及操作属性统计量;按照所述待分析用户终端之间的位置信息和操作属性的相似性,将所述待分析用户终端划分为若干用户终端群组;从同一用户终端群组中各用户终端的XDR数据中获得各用户终端的操作行为;将所述同一用户终端群组按照操作行为的相似性划分为若干用户终端子分组;将操作行为的相似性大于预设阈值的用户终端子分组内的用户终端确定为作弊用户终端。

【技术特征摘要】
1.一种电商行业作弊行为的检测方法,其特征在于,所述方法包括:接收用户分析请求,所述用户分析请求中包括检测时段以及各个待分析用户终端的标识信息;以所述待分析用户终端的标识信息为索引,提取出所述待分析用户终端在所述检测时段内产生的X数据记录XDR数据;从所述待分析用户终端产生的所述XDR数据中获得所述待分析用户终端的位置信息以及操作属性统计量;按照所述待分析用户终端之间的位置信息和操作属性的相似性,将所述待分析用户终端划分为若干用户终端群组;从同一用户终端群组中各用户终端的XDR数据中获得各用户终端的操作行为;将所述同一用户终端群组按照操作行为的相似性划分为若干用户终端子分组;将操作行为的相似性大于预设阈值的用户终端子分组内的用户终端确定为作弊用户终端。2.根据权利要求1所述的方法,其特征在于,所述从所述待分析用户终端产生的所述XDR数据中获得所述待分析用户终端的位置信息包括:根据所述XDR数据中记录的基站的位置信息,计算获得所述待分析用户终端的位置信息;或者,从所述XDR数据中提取所述待分析用户终端的位置信息。3.根据权利要求2所述的方法,其特征在于,所述从所述XDR数据中提取所述待分析用户终端的位置信息,包括:在所述XDR数据中的网络接口与预存的对应关系表中的网络接口匹配上时,从所述XDR数据中匹配上的网络接口对应的位置字段处提取出所述待分析用户终端的位置信息,所述对应关系表中包括网络接口和位置字段的对应关系。4.根据权利要求1所述的方法,其特征在于,所述按照所述待分析用户终端之间的位置信息和操作属性的相似性,将所述待分析用户终端划分为若干用户终端群组,包括:由所述待分析用户终端的位置信息、操作属性统计量构成待分析用户终端的特征向量,计算各待分析用户终端的特征向量之间的加权距离,其中,待分析用户终端的位置信息的权重大于操作属性统计量的权重;根据所述各待分析用户终端的特征向量之间的加权距离采用聚类算法,通过多次迭代将所述待分析用户终端聚类划分为若干用户终端群组。5.根据权利要求1所述的方法,其特征在于,所述从同一用户终端群组中各用户终端的XDR数据中获得各用户终端的操作行为;将所述同一用户终端群组按照操作行为的相似性划分为若干用户终端子分组;将操作行为的相似性大于预设阈值的用户终端子分组内的用户终端确定为作弊用户终端,包括:从同一用户终端群组中各用户终端的XDR数据中获得各用户终端的操作时间和操作类型;将各用户终端的操作时间和操作类型进行编码获得各用户终端的操作时间序列码;计算同一用户终端群组内各个用户终端之间的操作时间序列码的闵可夫斯基距离;根据所述同一用户终端群组内各个用户终端之间的闵可夫斯基距离,采用聚类算法,通过多次迭代将所述同一用户终端群组聚类划分成若干用户终端子分组;计算所述用户终端子分组内各用户终端之间的闵可夫斯基距离的均值和方差;在所述均值小于预设第一阈值且...

【专利技术属性】
技术研发人员:曾海涛
申请(专利权)人:中国移动通信集团公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1