【技术实现步骤摘要】
一种电商行业作弊行为的检测方法及装置
本专利技术涉及数据分析领域,尤其涉及一种电商行业作弊行为的检测方法及装置。
技术介绍
近年来随着通信网络和互联网平台的进一步发展,电子商务蓬勃发展,在线离线(OnlineToOffline,O2O)业务渗透到用户生活的方方面面。随之产生了一系列专门针对电子商务业务的欺诈、作弊行为,如各电商公司为了应对竞争,分别推出了一系列补贴、奖励政策;而投机分子采用刷单的手段利用假订单骗取补贴;或者,各网店为了提高曝光度和级别,雇佣一部分投机分子通过作弊方式进行销售量造假,或提高评价值。以上两种行为严重影响电商企业的正常运转,相应的电商企业也产生了一系列针对这些恶意行为的监控方法。现有技术主要采用以下两种方法来监控用户和商家的作弊行为。一种方法是规则匹配,即利用简单的规则匹配方式,发现可疑交易。例如设定为满足规则:买卖双方在短期内发生多次交易,或者出发点过于接近的用户和司机之间等等,则认为交易可疑。另一种方法是增强监控,通过采集更多的与业务相关的信息,来确认交易是否发生,或者是否正当。例如安装特定的客户端在“用车订单”执行过程中监控车辆全球定位系统(GlobalPositioningSystem,GPS)信息,并且采集基站、无线宽带(WiFi)、蓝牙等其他可用于定位的信息,来判断叫车订单是否按照预期执行,或者检测司机是否使用了虚假的GPS信息等。针对上述的监控方法,投机分子可以采用工程机变化身份,利用作弊机器修改设备串号等信息的能力,投机分子可能经常修改身份;或者,投机分子可以利用软件编程的方式来模拟普通用户的使用习惯,确保作弊机器 ...
【技术保护点】
一种电商行业作弊行为的检测方法,其特征在于,所述方法包括:接收用户分析请求,所述用户分析请求中包括检测时段以及各个待分析用户终端的标识信息;以所述待分析用户终端的标识信息为索引,提取出所述待分析用户终端在所述检测时段内产生的X数据记录XDR数据;从所述待分析用户终端产生的所述XDR数据中获得所述待分析用户终端的位置信息以及操作属性统计量;按照所述待分析用户终端之间的位置信息和操作属性的相似性,将所述待分析用户终端划分为若干用户终端群组;从同一用户终端群组中各用户终端的XDR数据中获得各用户终端的操作行为;将所述同一用户终端群组按照操作行为的相似性划分为若干用户终端子分组;将操作行为的相似性大于预设阈值的用户终端子分组内的用户终端确定为作弊用户终端。
【技术特征摘要】
1.一种电商行业作弊行为的检测方法,其特征在于,所述方法包括:接收用户分析请求,所述用户分析请求中包括检测时段以及各个待分析用户终端的标识信息;以所述待分析用户终端的标识信息为索引,提取出所述待分析用户终端在所述检测时段内产生的X数据记录XDR数据;从所述待分析用户终端产生的所述XDR数据中获得所述待分析用户终端的位置信息以及操作属性统计量;按照所述待分析用户终端之间的位置信息和操作属性的相似性,将所述待分析用户终端划分为若干用户终端群组;从同一用户终端群组中各用户终端的XDR数据中获得各用户终端的操作行为;将所述同一用户终端群组按照操作行为的相似性划分为若干用户终端子分组;将操作行为的相似性大于预设阈值的用户终端子分组内的用户终端确定为作弊用户终端。2.根据权利要求1所述的方法,其特征在于,所述从所述待分析用户终端产生的所述XDR数据中获得所述待分析用户终端的位置信息包括:根据所述XDR数据中记录的基站的位置信息,计算获得所述待分析用户终端的位置信息;或者,从所述XDR数据中提取所述待分析用户终端的位置信息。3.根据权利要求2所述的方法,其特征在于,所述从所述XDR数据中提取所述待分析用户终端的位置信息,包括:在所述XDR数据中的网络接口与预存的对应关系表中的网络接口匹配上时,从所述XDR数据中匹配上的网络接口对应的位置字段处提取出所述待分析用户终端的位置信息,所述对应关系表中包括网络接口和位置字段的对应关系。4.根据权利要求1所述的方法,其特征在于,所述按照所述待分析用户终端之间的位置信息和操作属性的相似性,将所述待分析用户终端划分为若干用户终端群组,包括:由所述待分析用户终端的位置信息、操作属性统计量构成待分析用户终端的特征向量,计算各待分析用户终端的特征向量之间的加权距离,其中,待分析用户终端的位置信息的权重大于操作属性统计量的权重;根据所述各待分析用户终端的特征向量之间的加权距离采用聚类算法,通过多次迭代将所述待分析用户终端聚类划分为若干用户终端群组。5.根据权利要求1所述的方法,其特征在于,所述从同一用户终端群组中各用户终端的XDR数据中获得各用户终端的操作行为;将所述同一用户终端群组按照操作行为的相似性划分为若干用户终端子分组;将操作行为的相似性大于预设阈值的用户终端子分组内的用户终端确定为作弊用户终端,包括:从同一用户终端群组中各用户终端的XDR数据中获得各用户终端的操作时间和操作类型;将各用户终端的操作时间和操作类型进行编码获得各用户终端的操作时间序列码;计算同一用户终端群组内各个用户终端之间的操作时间序列码的闵可夫斯基距离;根据所述同一用户终端群组内各个用户终端之间的闵可夫斯基距离,采用聚类算法,通过多次迭代将所述同一用户终端群组聚类划分成若干用户终端子分组;计算所述用户终端子分组内各用户终端之间的闵可夫斯基距离的均值和方差;在所述均值小于预设第一阈值且...
【专利技术属性】
技术研发人员:曾海涛,
申请(专利权)人:中国移动通信集团公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。