恶意订单识别方法及装置制造方法及图纸

技术编号:15503878 阅读:32 留言:0更新日期:2017-06-04 00:07
本公开是关于一种恶意订单识别方法及装置,属于电子技术领域。所述方法包括:对待识别的多个收货地址进行聚合,得到至少一个收货地址集;对于所述至少一个收货地址集中的每个收货地址集,确定所述收货地址集的第一公共字符单元和第一干扰字符单元;确定第一频率和第二频率,所述第一频率为所述第一公共字符单元在所述多个收货地址中出现的频率,所述第二频率为所述第一干扰字符单元在所述多个收货地址中出现的频率;基于所述第一频率和所述第二频率,确定第一比例;当所述第一比例大于或等于指定比例时,确定所述收货地址集的所有收货地址对应的订单均为恶意订单。本公开可以提高恶意订单识别的准确度。

Method and device for identifying malicious order

The present disclosure relates to a method and a device for identifying malicious orders, belonging to the field of electronic technology. The method comprises: a plurality of receiving address towards identification of polymerization to obtain at least one delivery address set; for each of the at least one delivery address on the delivery address set, the first public character unit and a first interference character unit determines that the delivery address set and determines a first frequency; the second frequency, the first frequency is the first public character units in the plurality of receiving address in frequency, the second frequency for the first character unit in interference of the plurality of receiving address in frequency; the first frequency and the second frequency is determined based on the first the proportion; when greater than or equal to the specified proportion of the first ratio, all receiving address corresponding to the order determines the delivery address set for malicious orders. This disclosure can improve the accuracy of malicious order recognition.

【技术实现步骤摘要】
恶意订单识别方法及装置
本公开涉及电子
,尤其涉及一种恶意订单识别方法及装置。
技术介绍
随着电子商务技术的快速发展,营销手段越来越丰富,例如,抢购、大规模促销等,这类营销活动的主要特点为:将商品设定为较低的价格,并在一个指定的时间点开放购买。在这类营销活动中,可能会出现一些恶意用户,采用违背活动规则的方式,大批量抢占资源,再以高价卖出。这些恶意用户的行为会严重影响其他具有真实购买意图的用户的利益,因此,需要对这些恶意用户的订单进行识别。恶意用户在购物平台上进行大批量的购买行为时,该恶意用户的订单中往往会存在大量的重复信息,该重复信息可能为收货地址、联系电话、收货人姓名、下单时所使用的终端的IP(InternetProtocolAddress,互联网协议)地址等。相关技术中,主要是通过订单包括的收货地址之间的相似度来对恶意订单进行识别,例如,确定多个订单中每两个订单包括的收货地址之间的相似度,如果某两个订单包括的收货地址之间的相似度大于指定相似度,则将这两个订单包括的收货地址均确定为目标收货地址,对于某个目标收货地址,如果该多个订单中该目标收货地址的数量大于指定数量,则将该目标收货地址对应的订单确定为恶意订单。
技术实现思路
为克服相关技术中存在的问题,本公开提供一种恶意订单识别方法及装置。根据本公开实施例的第一方面,提供一种恶意订单识别方法,所述方法包括:对待识别的多个收货地址进行聚合,得到至少一个收货地址集,所述至少一个收货地址集中任意两个收货地址集之间不包括相同的收货地址;对于所述至少一个收货地址集中的每个收货地址集,确定所述收货地址集的第一公共字符单元和第一干扰字符单元,所述第一公共字符单元为所述收货地址集的所有收货地址在同一位置处相同且字符个数最多的字符单元,所述第一干扰字符单元为所述收货地址集的所有收货地址中除所述第一公共字符单元之外的字符单元;确定第一频率和第二频率,所述第一频率为所述第一公共字符单元在所述多个收货地址中出现的频率,所述第二频率为所述第一干扰字符单元在所述多个收货地址中出现的频率;基于所述第一频率和所述第二频率,确定第一比例;当所述第一比例大于或等于指定比例时,确定所述收货地址集的所有收货地址对应的订单均为恶意订单。可选地,所述对待识别的多个收货地址进行聚合,得到至少一个收货地址集,包括:对于所述多个收货地址中的每个收货地址,分别从所述收货地址的多个特定位置处开始截取指定个数的字符,得到多个字符单元;对于所述多个字符单元中的每个字符单元,基于所述字符单元和所述字符单元在所述收货地址中的位置区间,生成标记单元,所述位置区间用于指示所述字符单元在所述收货地址中的开始位置和结束位置;将所述多个收货地址中满足指定条件的收货地址组合成一个收货地址集,所述指定条件为包括相同标记单元且所述相同标记单元在所述多个收货地址中出现的频率大于第一指定频率。可选地,所述确定所述收货地址集的第一公共字符单元和第一干扰字符单元,包括:确定多个标记单元,所述收货地址集的所有收货地址均在同一位置处包含所述多个标记单元中每个标记单元对应的字符单元;将所述多个标记单元中位置区间相邻或相交的标记单元对应的字符单元组合为公共字符单元;将组合得到的公共字符单元中字符个数最多的字符单元确定为所述第一公共字符单元;将所述收货地址集的所有收货地址中除所述第一公共字符单元之外的字符单元确定为所述第一干扰字符单元。可选地,所述确定第一频率,包括:按照指定切分规则,对所述第一公共字符单元进行切分,得到多个第一分词;从所述多个收货地址的辅助词表中,获取所述多个第一分词中每个第一分词对应的频率,所述多个收货地址的辅助词表用于对应存储目标分词和所述目标分词在所述多个收货地址中出现的频率,所述目标分词在所述多个收货地址中出现的频率大于第二指定频率;将所述多个第一分词中每个第一分词对应的频率进行累加,得到所述第一频率。可选地,所述确定第二频率,包括:按照指定切分规则,对所述第一干扰字符单元进行切分,得到多个第二分词;从所述多个收货地址的辅助词表中,获取所述多个第二分词中每个第二分词对应的频率;将所述多个第二分词中每个第二分词对应的频率进行累加,得到所述第二频率。可选地,所述基于所述第一频率和所述第二频率,确定第一比例,包括:基于所述第一频率和所述第二频率,通过如下指定公式得到所述第一比例;所述指定公式为:或者,其中,S为所述第一比例,F为所述第一频率,f为所述第二频率,L为所述多个收货地址包括的字符个数。可选地,所述当所述第一比例大于或等于指定比例时,确定所述收货地址集的所有收货地址对应的订单均为恶意订单之前,还包括:对存储的多个恶意地址进行聚合,得到至少一个恶意地址集,所述至少一个恶意地址集中任意两个恶意地址集之间不包括相同的恶意地址;对于所述至少一个恶意地址集中的每个恶意地址集,确定所述恶意地址集的第二公共字符单元和第二干扰字符单元,所述第二公共字符单元为所述恶意地址集的所有恶意地址在同一位置处相同且字符个数最多的字符单元,所述第二干扰字符单元为所述恶意地址集的所有恶意地址中除所述第二公共字符单元之外的字符单元;确定第三频率和第四频率,所述第三频率为所述第二公共字符单元在所述多个恶意地址中出现的频率,所述第四频率为所述第二干扰字符单元在所述多个恶意地址中出现的频率;基于所述第三频率和所述第四频率,确定第二比例;基于多个第二比例,确定所述指定比例,所述多个第二比例与所述多个恶意地址集一一对应。可选地,所述基于多个第二比例,确定所述指定比例,包括:将所述多个第二比例中大于或等于目标比例的个数除以所述多个第二比例的总个数,得到目标数值;当所述目标数值大于或等于指定数值时,确定所述目标比例为所述指定比例。根据本公开实施例的第二方面,提供一种恶意订单识别装置,所述装置包括:第一聚合模块,用于对待识别的多个收货地址进行聚合,得到至少一个收货地址集,所述至少一个收货地址集中任意两个收货地址集之间不包括相同的收货地址;第一确定模块,用于对于所述至少一个收货地址集中的每个收货地址集,确定所述收货地址集的第一公共字符单元和第一干扰字符单元,所述第一公共字符单元为所述收货地址集的所有收货地址在同一位置处相同且字符个数最多的字符单元,所述第一干扰字符单元为所述收货地址集的所有收货地址中除所述第一公共字符单元之外的字符单元;第二确定模块,用于确定第一频率和第二频率,所述第一频率为所述第一公共字符单元在所述多个收货地址中出现的频率,所述第二频率为所述第一干扰字符单元在所述多个收货地址中出现的频率;第三确定模块,用于基于所述第一频率和所述第二频率,确定第一比例;第四确定模块,用于当所述第一比例大于或等于指定比例时,确定所述收货地址集的所有收货地址对应的订单均为恶意订单。可选地,所述第一聚合模块包括:截取子模块,用于对于所述多个收货地址中的每个收货地址,分别从所述收货地址的多个特定位置处开始截取指定个数的字符,得到多个字符单元;生成子模块,用于对于所述多个字符单元中的每个字符单元,基于所述字符单元和所述字符单元在所述收货地址中的位置区间,生成标记单元,所述位置区间用于指示所述字符单元在所述收货地址中的开始位置和结束位置;第一组合子模块,用于将所述本文档来自技高网...
恶意订单识别方法及装置

【技术保护点】
一种恶意订单识别方法,其特征在于,所述方法包括:对待识别的多个收货地址进行聚合,得到至少一个收货地址集,所述至少一个收货地址集中任意两个收货地址集之间不包括相同的收货地址;对于所述至少一个收货地址集中的每个收货地址集,确定所述收货地址集的第一公共字符单元和第一干扰字符单元,所述第一公共字符单元为所述收货地址集的所有收货地址在同一位置处相同且字符个数最多的字符单元,所述第一干扰字符单元为所述收货地址集的所有收货地址中除所述第一公共字符单元之外的字符单元;确定第一频率和第二频率,所述第一频率为所述第一公共字符单元在所述多个收货地址中出现的频率,所述第二频率为所述第一干扰字符单元在所述多个收货地址中出现的频率;基于所述第一频率和所述第二频率,确定第一比例;当所述第一比例大于或等于指定比例时,确定所述收货地址集的所有收货地址对应的订单均为恶意订单。

【技术特征摘要】
1.一种恶意订单识别方法,其特征在于,所述方法包括:对待识别的多个收货地址进行聚合,得到至少一个收货地址集,所述至少一个收货地址集中任意两个收货地址集之间不包括相同的收货地址;对于所述至少一个收货地址集中的每个收货地址集,确定所述收货地址集的第一公共字符单元和第一干扰字符单元,所述第一公共字符单元为所述收货地址集的所有收货地址在同一位置处相同且字符个数最多的字符单元,所述第一干扰字符单元为所述收货地址集的所有收货地址中除所述第一公共字符单元之外的字符单元;确定第一频率和第二频率,所述第一频率为所述第一公共字符单元在所述多个收货地址中出现的频率,所述第二频率为所述第一干扰字符单元在所述多个收货地址中出现的频率;基于所述第一频率和所述第二频率,确定第一比例;当所述第一比例大于或等于指定比例时,确定所述收货地址集的所有收货地址对应的订单均为恶意订单。2.如权利要求1所述的方法,其特征在于,所述对待识别的多个收货地址进行聚合,得到至少一个收货地址集,包括:对于所述多个收货地址中的每个收货地址,分别从所述收货地址的多个特定位置处开始截取指定个数的字符,得到多个字符单元;对于所述多个字符单元中的每个字符单元,基于所述字符单元和所述字符单元在所述收货地址中的位置区间,生成标记单元,所述位置区间用于指示所述字符单元在所述收货地址中的开始位置和结束位置;将所述多个收货地址中满足指定条件的收货地址组合成一个收货地址集,所述指定条件为包括相同标记单元且所述相同标记单元在所述多个收货地址中出现的频率大于第一指定频率。3.如权利要求2所述的方法,其特征在于,所述确定所述收货地址集的第一公共字符单元和第一干扰字符单元,包括:确定多个标记单元,所述收货地址集的所有收货地址均在同一位置处包含所述多个标记单元中每个标记单元对应的字符单元;将所述多个标记单元中位置区间相邻或相交的标记单元对应的字符单元组合为公共字符单元;将组合得到的公共字符单元中字符个数最多的字符单元确定为所述第一公共字符单元;将所述收货地址集的所有收货地址中除所述第一公共字符单元之外的字符单元确定为所述第一干扰字符单元。4.如权利要求1所述的方法,其特征在于,所述确定第一频率,包括:按照指定切分规则,对所述第一公共字符单元进行切分,得到多个第一分词;从所述多个收货地址的辅助词表中,获取所述多个第一分词中每个第一分词对应的频率,所述多个收货地址的辅助词表用于对应存储目标分词和所述目标分词在所述多个收货地址中出现的频率,所述目标分词在所述多个收货地址中出现的频率大于第二指定频率;将所述多个第一分词中每个第一分词对应的频率进行累加,得到所述第一频率。5.如权利要求1所述的方法,其特征在于,所述确定第二频率,包括:按照指定切分规则,对所述第一干扰字符单元进行切分,得到多个第二分词;从所述多个收货地址的辅助词表中,获取所述多个第二分词中每个第二分词对应的频率;将所述多个第二分词中每个第二分词对应的频率进行累加,得到所述第二频率。6.如权利要求1所述的方法,其特征在于,所述基于所述第一频率和所述第二频率,确定第一比例,包括:基于所述第一频率和所述第二频率,通过如下指定公式得到所述第一比例;所述指定公式为:或者,其中,S为所述第一比例,F为所述第一频率,f为所述第二频率,L为所述多个收货地址包括的字符个数。7.如权利要求1-6任一权利要求所述的方法,其特征在于,所述当所述第一比例大于或等于指定比例时,确定所述收货地址集的所有收货地址对应的订单均为恶意订单之前,还包括:对存储的多个恶意地址进行聚合,得到至少一个恶意地址集,所述至少一个恶意地址集中任意两个恶意地址集之间不包括相同的恶意地址;对于所述至少一个恶意地址集中的每个恶意地址集,确定所述恶意地址集的第二公共字符单元和第二干扰字符单元,所述第二公共字符单元为所述恶意地址集的所有恶意地址在同一位置处相同且字符个数最多的字符单元,所述第二干扰字符单元为所述恶意地址集的所有恶意地址中除所述第二公共字符单元之外的字符单元;确定第三频率和第四频率,所述第三频率为所述第二公共字符单元在所述多个恶意地址中出现的频率,所述第四频率为所述第二干扰字符单元在所述多个恶意地址中出现的频率;基于所述第三频率和所述第四频率,确定第二比例;基于多个第二比例,确定所述指定比例,所述多个第二比例与所述多个恶意地址集一一对应。8.如权利要求7所述的方法,其特征在于,所述基于多个第二比例,确定所述指定比例,包括:将所述多个第二比例中大于或等于目标比例的个数除以所述多个第二比例的总个数,得到目标数值;当所述目标数值大于或等于指定数值时,确定所述目标比例为所述指定比例。9.一种恶意订单识别装置,其特征在于,所述装置包括:第一聚合模块,用于对待识别的多个收货地址进行聚合,得到至少一个收货地址集,所述至少一个收货地址集中任意两个收货地址集之间不包括相同的收货地址;第一确定模块,用于对于所述至少一个收货地址集中的每个收货地址集,确定所述收货地址集的第一公共字符单元和第一干扰字符单元,所述第一公共字符单元为所述收货地址集的所有收货地址在同一位置处相同且字符个数最多的字符单元,所述第一干扰字符单元为所述收货地址集的所有收货地址中除所述第一公共字符单元之外的字符单元;第二确定模块,用于确定第一频率和第二频率,所述第一...

【专利技术属性】
技术研发人员:于亮马利超刘杨
申请(专利权)人:北京小米移动软件有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1