一种异常账号的识别方法、装置、设备和存储介质制造方法及图纸

技术编号:26172895 阅读:25 留言:0更新日期:2020-10-31 13:52
本申请公开了一种异常账号的识别方法、装置、设备和存储介质,涉及数据处理、大数据和云计算领域。具体实现方案为:根据连续历史时间单元内注册账号数量的变化趋势,筛选出异常历史时间单元;获取在所述异常历史时间单元内完成注册的至少一个目标账号;在各所述目标账号中,筛选出满足异常注册时间,和/或异常注册用户名条件的异常账号。本申请实施例的技术方案可以仅依据账号间存在的异常聚集行为进行作弊判定,能够更快更好的实现作弊检测。

【技术实现步骤摘要】
一种异常账号的识别方法、装置、设备和存储介质
本申请涉及计算机
,尤其数据检测、大数据和云计算技术,具体涉及一种异常账号的识别方法、装置、设备和存储介质。
技术介绍
目前,各种应用程序提供了很多可以由用户自主生产数据的任务,例如,百度地图POI(PointofInterest,信息点)数据的免费标注。上述任务可能会存在用户作弊行为。例如,针对上述免费标注任务的恶意上点导流、恶意商业竞争或者收费代理等作弊行为。现有技术中的反作弊系统一般是利用专家业务经验制定规则类策略,提取单个账号的历史上报数据,如果触发策略阈值,则对账号进行拉黑或者限制上报等处理。事实上互联网黑产早已完成“自动化注册+养号+账号交易+作弊+分赃”的全链路协作,账号的注册成本极低,对单账号的反作弊往往治标不治本,无法有效的杜绝或者改善上述作弊行为。
技术实现思路
本申请提供了一种异常账号的识别的方法、装置、设备以及存储介质。根据本申请的一方面,提供了一种异常账号的识别方法,包括:根据连续历史时间单元内注册账号数量的变化趋势,筛选出异常历史时间单元;获取在所述异常历史时间单元内完成注册的至少一个目标账号;在各所述目标账号中,筛选出满足异常注册时间,和/或异常注册用户名条件的异常账号。根据本申请的另一方面,提供了一种异常账号的识别装置,包括:异常历史时间单元筛选模块,用于根据连续历史时间单元内注册账号数量的变化趋势,筛选出异常历史时间单元;目标账号获取模块,用于获取在所述异常历史时间单元内完成注册的至少一个目标账号;异常账号筛选模块,用于在各所述目标账号中,筛选出满足异常注册时间,和/或异常注册用户名条件的异常账号。根据本申请的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请实施例中任一项所述的方法。根据本申请的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本申请实施例中任一项所述的方法。根据本申请实施例的技术方案,根据连续历史时间单元内注册账号数量的变化趋势,筛选出异常历史时间单元,然后获取在异常历史时间单元内完成注册的至少一个目标账号,最终在各目标账号中,筛选出满足异常注册时间,和/或异常注册用户名条件的异常账号,解决了现有技术中利用专家业务经验制定规则类策略无法有效杜绝作弊行为的问题,可以仅依据账号间存在的异常聚集行为进行作弊判定,能够更快更好的实现作弊检测。应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是根据本申请实施例的一种异常账号的识别方法的示意图;图2a是根据本申请实施例的一种异常账号的识别方法的示意图;图2b是本申请实施例的通过LOF算法得到异常因子的示意图;图3a是根据本申请实施例的一种异常账号的识别方法的示意图;图3b是本申请实施例所适用的一种拟合曲线示意图;图4根据本申请实施例的一种异常账号的识别装置的结构示意图;图5是用来实现本申请实施例的异常账号的识别方法的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。图1是本申请实施例中的一种异常账号的识别方法的示意图,本实施例的技术方案适用于通过历史时间单元的账号注册数量进行作弊判定的情况,该方法可以由异常账号的识别装置执行,该装置可以通过软件,和/或硬件的方式实现,并一般可以集成在电子设备中,例如终端设备中,本实施例的方法具体包括以下步骤:步骤110、根据连续历史时间单元内注册账号数量的变化趋势,筛选出异常历史时间单元。其中,历史时间单元是进行异常账号识别的标准时间区间,即以该标准时间区间为单位时间进行异常账号的识别,示例性的,历史时间单元可以是1天。本实施例中,为了识别连续历史时间单元内的异常账号,首先获取连续历史时间单元内各历史时间单元的注册账号数量,然后根据各历史时间单元内的注册账号数量,确定连续历史时间单元内的注册账号数量的变化趋势,最终将与变化趋势不相符的历史时间单元确定为异常历史时间单元,即初步认为该历史时间单元内存在异常账号注册。示例性的,首先获取连续60天内每天的注册账号数量,然后这60天内每天的注册账号数量进行拟合,得到这60天中注册账号数量的拟合曲线,并进一步判断每天的注册账号数量偏离上述拟合曲线的偏离量,若偏离量超过设定的偏离阈值,则确定这一天为异常历史时间单元。步骤120、获取在异常历史时间单元内完成注册的至少一个目标账号。本实施例中,在确定异常历史时间单元后,从历史存储数据中获取异常历史时间单元内完成注册的全部账号,作为目标账号,目标账号为需要后续进行异常账号判断的账号。示例性的,在确定连续60天中的第30天为异常历史时间单元后,获取在第30天内完成注册的全部账号作为目标账号,即这些目标账号中可能存在异常账号。步骤130、在各目标账号中,筛选出满足异常注册时间,和/或异常注册用户名条件的异常账号。本实施例中,在获取到异常历史时间单元中包含的目标账号后,进行数据检测,以便在各目标账号中筛选异常账号,具体为,提取各目标账号对应的注册时间和注册用户名,然后判断各目标账号对应的注册时间是否满足异常注册时间条件,并判断各目标账号的注册用户名是否满足异常注册用户名条件,当目标账号的注册时间或注册用户名满足上述异常条件,确定该目标账号为异常账号;当然,可以根据实际情况,在目标账号的注册时间和注册用户名同时满足上述两个异常条件时,才确定该目标账号为异常账号。示例性的,获取各目标账号的注册时间和注册用户名,然后计算各目标账号的注册时间差,将注册时间的时间差低于设定阈值的多个目标账号确定为满足异常注册时间条件,并将这些目标账号确定为异常账号;还可以计算各目标账号的注册用户名之间的相似度,将注册用户名与超过设定数量的目标账号的注册用户名的相似度超过设定相似度阈值的多个目标账号确定为满足异常注册用户名条件,并将这些目标账号确定为异常账号。当然也可以在某一目标账号同时满足上述两个异常条件时,确定该目标账号为异常账号。本申请实施例的技术方案,根据连续历史时间单元内注册账号数量的变化趋势,筛选出异常历史时间单元,然后本文档来自技高网...

【技术保护点】
1.一种异常账号的识别方法,包括:/n根据连续历史时间单元内注册账号数量的变化趋势,筛选出异常历史时间单元;/n获取在所述异常历史时间单元内完成注册的至少一个目标账号;/n在各所述目标账号中,筛选出满足异常注册时间,和/或异常注册用户名条件的异常账号。/n

【技术特征摘要】
1.一种异常账号的识别方法,包括:
根据连续历史时间单元内注册账号数量的变化趋势,筛选出异常历史时间单元;
获取在所述异常历史时间单元内完成注册的至少一个目标账号;
在各所述目标账号中,筛选出满足异常注册时间,和/或异常注册用户名条件的异常账号。


2.根据权利要求1所述的方法,其中,所述根据连续历史时间单元内注册账号数量的变化趋势,筛选出异常历史时间单元包括:
针对各历史时间单元,沿时间延伸方向的反方向,获取位于各所述历史时间单元之前的连续多个参考历史时间单元;
根据各所述参考历史时间单元内的注册账号数量,拟合得到与各所述历史时间单元对应的账号数量预测曲线;
根据各所述账号数量预测曲线,确定与各所述历史时间单元对应的账号数量预测值;
根据各所述历史时间单元内的注册账号数量与对应的账号数量预测值之间的差异值,验证各所述历史时间单元是否为异常历史时间单元。


3.根据权利要求1所述的方法,其中,所述根据连续历史时间单元内注册账号数量的变化趋势,筛选出异常历史时间单元包括:
获取设定历史时间区间包括的各历史时间单元内的注册账号数量;
根据各所述注册账号数量,拟合得到与所述历史时间区间匹配的账号数量拟合曲线;
根据所述账号数量拟合曲线,确定与各所述历史时间单元分别对应的账号数量拟合值;
根据各所述历史时间单元内的注册账号数量与对应的账号数量拟合值之间的差异值,验证各所述历史时间单元是否为异常历史时间单元。


4.根据权利要求2所述的方法,其中,所述根据各所述历史时间单元内的注册账号数量与对应的账号数量预测值之间的差异值,验证各所述历史时间单元是否为异常历史时间单元包括:
获取当前处理的目标历史时间单元的注册账号数量与对应的账号数量预测值之间的绝对差值;
计算所述绝对差值与所述目标历史时间单元的注册账号数量之间的比值;
如果所述比值超过预设的第一门限阈值,则确定所述目标历史时间单元为异常历史时间单元。


5.根据权利要求3所述的方法,其中,所述根据各所述历史时间单元内的注册账号数量与对应的账号数量拟合值之间的差异值,验证各所述历史时间单元是否为异常历史时间单元包括:
获取当前处理的目标历史时间单元的注册账号数量与对应的账号数量拟合值之间的绝对差值;
计算所述绝对差值与所述目标历史时间单元的注册账号数量之间的比值;
如果所述比值超过预设的第二门限阈值,则确定所述目标历史时间单元为异常历史时间单元。


6.根据权利要求1所述的方法,其中,所述在各所述目标账号中,筛选出满足异常注册时间,和/或异常注册用户名条件的异常账号包括:
采用局部离群因子LOF算法,以各所述目标账号的注册时间和注册用户名为特征,计算与各所述目标账号分别对应的异常因子;
将异常因子超过预设的第三门限阈值的目标账号,确定为离群账号;
在各所述目标账号中,滤除所述离群账号,得到所述异常账号。


7.根据权利要求1所述的方法,在所述在各所述目标账号中,筛选出满足异常注册时间,和/或异常注册用户名条件的异常账号之后,还包括:
在全部注册账号中,滤除各所述异常账号后,重新确定新的异常历史时间单元,并返回执行获取在所述异常历史时间单元内完成注册的至少一个目标账号的操作,直至完成对全部异常账号的筛选。


8.根据权利要求1所述的方法,在所述在各所述目标账号中,筛选出满足异常注册时间,和/或异常注册用户名条件的异常账号之后,还包括:
对筛选得到的异常账号进行批量拉黑处理。


9.一种异常账号的识别装置,包括:
异常历史时间单元筛选模块,用于根据连续历史时间单元内注册账号数量的变化趋势,筛选出异常历史时间单元;
目标账号获取模块,用于获取在所述异常历史时间单元内完成注册的至少一个目标账号;

【专利技术属性】
技术研发人员:何守伟
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1