The embodiment of the present invention provides a method and device for identifying problematic accounts based on Storm cluster, which includes: Storm cluster receives and parses logs from real-time pushed Kafka data source, counts the number of mobile phone numbers that each account tries to bind in real-time, including the account number and the number of mobile phone numbers that the account tries to bind in the logs, and judges the number of mobile phone numbers that each account tries to bind in real-time; If the number of mobile phone numbers that an account tries to bind is greater than the first threshold, then the account is determined to be a problematic account. In the field of distributed system and log analysis, the method of the present invention can read and process the formed log in real time, obtain the number of mobile phone numbers bound to any account, and take real-time blocking treatment to maliciously bound mobile phone accounts in time.
【技术实现步骤摘要】
一种基于Storm集群识别问题账号的方法及装置
本专利技术涉及分布式系统、日志分析领域,尤其涉及基于Storm集群识别问题账号的方法及装置。
技术介绍
目前账号是用户在网络世界中的身份凭证,有些黑色产业链掌控了部分账号,形成账号库,这些账号大多用于非法用途,如发广告、刷关注、伪造账号、刷量等。但是很多网站要求绑定手机才能以该用户身份使用其功能,因此黑色产业链会使用计算机程序对其账号库中的账号进行批量绑定手机的操作。这种账号一旦绑定成功,一定会立即开始不法行为,因此这一部分账号是网站要加以识别并封禁的。一般在同一网站只能绑定一个手机号只能绑定一个账号,如果将要绑定的手机号已经绑定了同一网站的其他账号,则会要求用户再次绑定其他手机号码。因此非法账号集团会将其可用的手机号码库中的手机号逐一尝试绑定。这些绑定账号的过程均被记录在日志中。其格式如下;2018-01-1816:40:27|120.33.247.87|24039|1705171****其中24039是用户唯一账号UID。目前识别非法绑定账号基本通过使用python脚本来完成,如下:从头到尾遍历日志,对于每行日志 ...
【技术保护点】
1.一种基于Storm集群识别问题账号的方法,其特征在于,包括:Storm集群从实时推送的Kafka数据源中接收并解析日志,实时统计每一个账号尝试绑定的手机号个数,所述日志中包括账号以及该账号尝试绑定的手机号;实时判断每个账号尝试绑定的手机号个数是否大于设定的第一阈值,如果某一账号尝试绑定的手机号个数大于所述第一阈值,则判定该账号为问题账号。
【技术特征摘要】
1.一种基于Storm集群识别问题账号的方法,其特征在于,包括:Storm集群从实时推送的Kafka数据源中接收并解析日志,实时统计每一个账号尝试绑定的手机号个数,所述日志中包括账号以及该账号尝试绑定的手机号;实时判断每个账号尝试绑定的手机号个数是否大于设定的第一阈值,如果某一账号尝试绑定的手机号个数大于所述第一阈值,则判定该账号为问题账号。2.根据权利要求1所述的实时识别问题账号的方法,其特征在于,Storm集群从实时推送的Kafka数据源中接收并解析日志,实时统计每一个账号尝试绑定的手机号个数,具体包括:Storm集群将从所述Kafka数据源中接收的日志实时分配到N个工作单元Bolt中;各工作单元Bolt实时解析接收到的每一条日志,从当前日志中获得账号以及该账号尝试绑定的手机号;并根据获得的账号以及该账号尝试绑定的手机号,更新该账号对应存储的尝试绑定的手机号个数。3.根据权利要求2所述的实时识别问题账号的方法,其特征在于,在可自动过期的高速键值存储器S中,以键值对的形式存储每个账号及其尝试绑定的手机号个数;其中,所述键值对的键为账号,所述键值对的值为该账号尝试绑定的手机号个数;如果每条键值对在设定时长内未更新,则从所述高速键值存储器S中消失;所述根据获得的账号以及该账号尝试绑定的手机号,更新该账号对应存储的尝试绑定的手机号个数,包括:判断高速键值存储器S中是否有以当前账号为键的键值对,若没有,则在高速键值存储器S中写入新的键值对,所述新的键值对的键为当前账号,所述新的键值对的值为1;若有,则将当前账号对应的值加1后覆盖写入高速键值存储器S。4.根据权利要求3所述的实时识别问题账号的方法,其特征在于,实时判断每个账号尝试绑定的手机号个数是否大于设定的第一阈值,具体包括:在将当前账号对应的值加1后覆盖写入高速键值存储器S时,判断当前账号对应的值是否大于所述第一阈值。5.根据权利要求3所述的实时识别问题账号的方法,其特征在于,还包括:判定出问题账号之后,将所述问题账号封禁;并将所述高...
【专利技术属性】
技术研发人员:王嘉伟,
申请(专利权)人:微梦创科网络科技中国有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。