【技术实现步骤摘要】
一种异常账号的识别方法、装置、设备和存储介质
本申请涉及计算机
,尤其数据检测、大数据和云计算技术,具体涉及一种异常账号的识别方法、装置、设备和存储介质。
技术介绍
目前,各种应用程序提供了很多可以由用户自主生产数据的任务,例如,百度地图POI(PointofInterest,信息点)数据的免费标注。上述任务可能会存在用户作弊行为。例如,针对上述免费标注任务的恶意上点导流、恶意商业竞争或者收费代理等作弊行为。现有技术中的反作弊系统一般是利用专家业务经验制定规则类策略,提取单个账号的历史上报数据,如果触发策略阈值,则对账号进行拉黑或者限制上报等处理。事实上互联网黑产早已完成“自动化注册+养号+账号交易+作弊+分赃”的全链路协作,账号的注册成本极低,对单账号的反作弊往往治标不治本,无法有效的杜绝或者改善上述作弊行为。
技术实现思路
本申请提供了一种异常账号的识别的方法、装置、设备以及存储介质。根据本申请的一方面,提供了一种异常账号的识别方法,包括:根据连续历史时间单元内注册账号数量的变化趋势,筛选出异常历史时间单元;获取在所述异常历史时间单元内完成注册的至少一个目标账号;在各所述目标账号中,筛选出满足异常注册时间,和/或异常注册用户名条件的异常账号。根据本申请的另一方面,提供了一种异常账号的识别装置,包括:异常历史时间单元筛选模块,用于根据连续历史时间单元内注册账号数量的变化趋势,筛选出异常历史时间单元;目标账号获取 ...
【技术保护点】
1.一种异常账号的识别方法,包括:/n根据连续历史时间单元内注册账号数量的变化趋势,筛选出异常历史时间单元;/n获取在所述异常历史时间单元内完成注册的至少一个目标账号;/n在各所述目标账号中,筛选出满足异常注册时间,和/或异常注册用户名条件的异常账号。/n
【技术特征摘要】 【专利技术属性】
1.一种异常账号的识别方法,包括:
根据连续历史时间单元内注册账号数量的变化趋势,筛选出异常历史时间单元;
获取在所述异常历史时间单元内完成注册的至少一个目标账号;
在各所述目标账号中,筛选出满足异常注册时间,和/或异常注册用户名条件的异常账号。
2.根据权利要求1所述的方法,其中,所述根据连续历史时间单元内注册账号数量的变化趋势,筛选出异常历史时间单元包括:
针对各历史时间单元,沿时间延伸方向的反方向,获取位于各所述历史时间单元之前的连续多个参考历史时间单元;
根据各所述参考历史时间单元内的注册账号数量,拟合得到与各所述历史时间单元对应的账号数量预测曲线;
根据各所述账号数量预测曲线,确定与各所述历史时间单元对应的账号数量预测值;
根据各所述历史时间单元内的注册账号数量与对应的账号数量预测值之间的差异值,验证各所述历史时间单元是否为异常历史时间单元。
3.根据权利要求1所述的方法,其中,所述根据连续历史时间单元内注册账号数量的变化趋势,筛选出异常历史时间单元包括:
获取设定历史时间区间包括的各历史时间单元内的注册账号数量;
根据各所述注册账号数量,拟合得到与所述历史时间区间匹配的账号数量拟合曲线;
根据所述账号数量拟合曲线,确定与各所述历史时间单元分别对应的账号数量拟合值;
根据各所述历史时间单元内的注册账号数量与对应的账号数量拟合值之间的差异值,验证各所述历史时间单元是否为异常历史时间单元。
4.根据权利要求2所述的方法,其中,所述根据各所述历史时间单元内的注册账号数量与对应的账号数量预测值之间的差异值,验证各所述历史时间单元是否为异常历史时间单元包括:
获取当前处理的目标历史时间单元的注册账号数量与对应的账号数量预测值之间的绝对差值;
计算所述绝对差值与所述目标历史时间单元的注册账号数量之间的比值;
如果所述比值超过预设的第一门限阈值,则确定所述目标历史时间单元为异常历史时间单元。
5.根据权利要求3所述的方法,其中,所述根据各所述历史时间单元内的注册账号数量与对应的账号数量拟合值之间的差异值,验证各所述历史时间单元是否为异常历史时间单元包括:
获取当前处理的目标历史时间单元的注册账号数量与对应的账号数量拟合值之间的绝对差值;
计算所述绝对差值与所述目标历史时间单元的注册账号数量之间的比值;
如果所述比值超过预设的第二门限阈值,则确定所述目标历史时间单元为异常历史时间单元。
6.根据权利要求1所述的方法,其中,所述在各所述目标账号中,筛选出满足异常注册时间,和/或异常注册用户名条件的异常账号包括:
采用局部离群因子LOF算法,以各所述目标账号的注册时间和注册用户名为特征,计算与各所述目标账号分别对应的异常因子;
将异常因子超过预设的第三门限阈值的目标账号,确定为离群账号;
在各所述目标账号中,滤除所述离群账号,得到所述异常账号。
7.根据权利要求1所述的方法,在所述在各所述目标账号中,筛选出满足异常注册时间,和/或异常注册用户名条件的异常账号之后,还包括:
在全部注册账号中,滤除各所述异常账号后,重新确定新的异常历史时间单元,并返回执行获取在所述异常历史时间单元内完成注册的至少一个目标账号的操作,直至完成对全部异常账号的筛选。
8.根据权利要求1所述的方法,在所述在各所述目标账号中,筛选出满足异常注册时间,和/或异常注册用户名条件的异常账号之后,还包括:
对筛选得到的异常账号进行批量拉黑处理。
9.一种异常账号的识别装置,包括:
异常历史时间单元筛选模块,用于根据连续历史时间单元内注册账号数量的变化趋势,筛选出异常历史时间单元;
目标账号获取模块,用于获取在所述异常历史时间单元内完成注册的至少一个目标账号;
技术研发人员:何守伟,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。