【技术实现步骤摘要】
基于大数据的异常用户识别方法及装置、电子设备、介质
本公开涉及大数据
,尤其涉及一种基于大数据的异常用户识别方法及装置、电子设备、计算机可读存储介质。
技术介绍
互联网以及各种基于互联网的应用程序(Application,简称App)的发展极大的方便了人们的日常生活,然而也有一些用户通过滥用互联网或App服务获取不正当利益,例如网络上出现的虚假用户、虚假“粉丝”、恶意刷单、恶意广告等异常用户及异常用户行为,影响了网站或App的正常运营,因此需要将这些异常用户行为识别出来并加以处理。现有的异常用户识别方法多数是建立异常用户的特征数据库,然后将待识别的用户行为数据与该特征数据库进行匹配,例如进行正则匹配或计算行为数据的余弦相似度等,根据匹配的结果做出判断。然而该方法需要事先建立特征数据库,在缺乏经验数据或历史数据的情况下难以适用;并且用户行为具有复杂的多样性,特征数据库难以覆盖所有类型的异常用户,因此通过特征数据库匹配容易产生遗漏,影响识别结果的准确性。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人 ...
【技术保护点】
1.一种基于大数据的异常用户识别方法,其特征在于,所述方法包括:获取多个用户的行为日志,并按照周期与特征统计每个所述用户的行为数据;计算每个所述用户的每个所述特征在各所述周期的行为数据的波动指数,并根据波动阈值判断每个所述用户的每个所述特征是否为波动特征,得到用户‑特征波动属性表;统计所述用户‑特征波动属性表中各波动特征组合的出现概率,将所述出现概率达到最小支持度的波动特征组合判断为异常特征组合;将所述用户中波动特征包含任一所述异常特征组合的用户识别为异常用户。
【技术特征摘要】
1.一种基于大数据的异常用户识别方法,其特征在于,所述方法包括:获取多个用户的行为日志,并按照周期与特征统计每个所述用户的行为数据;计算每个所述用户的每个所述特征在各所述周期的行为数据的波动指数,并根据波动阈值判断每个所述用户的每个所述特征是否为波动特征,得到用户-特征波动属性表;统计所述用户-特征波动属性表中各波动特征组合的出现概率,将所述出现概率达到最小支持度的波动特征组合判断为异常特征组合;将所述用户中波动特征包含任一所述异常特征组合的用户识别为异常用户。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:统计所述用户-特征波动属性表中所述异常特征组合的关联概率,将所述关联概率小于最小置信度的异常特征组合从所述异常特征组合的集合中移除。3.根据权利要求1所述的方法,其特征在于,根据波动阈值判断每个所述用户的每个所述特征是否为波动特征包括:确定每个所述特征的波动阈值;比较每个所述用户的每个所述特征的波动指数与所述特征的波动阈值;如果所述波动指数大于所述波动阈值,则将所述用户的所述特征判断为波动特征。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:在得到所述用户-特征波动属性表后,统计每个所述特征在全部所述用户中被判断为波动特征的比例;从所述用户-特征波动属性表中移除所述比例大于用户波动比例阈值的特征。5.根据权利要求1所述的方...
【专利技术属性】
技术研发人员:黄强,
申请(专利权)人:中国平安人寿保险股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。