【技术实现步骤摘要】
本专利技术涉及网络
,特别是涉及一种用户类别检测方法和装置。
技术介绍
互联网技术的发展,给人们之间的沟通交流带来了极大的便利,但与此同时,也给一些恶意用户从事非法活动提供了便利条件。目前将恶意用户从事破坏活动的集合称为黑色产业,简称黑产,而从事黑色产业的人员则称为黑色产业人员。黑色产业包括故意制作与传播计算机病毒、倒卖公民个人信息、架设钓鱼网站、电话诈骗以及短信诈骗等。目前考虑到黑色产业人员需要通过互联网来传播黑色产业技术,并拓展自己的业务,因此可以通过查找关键词的方式来检测黑色产业人员。但这种方式检测黑色产业人员的准确率主要依赖于关键词是否准确以及关键词覆盖是否全面,黑色产业人员可以通过改换名称这样简单的方式就可以轻易避开关键词检测。因此,目前通过查找关键词的方式来检测黑色产业人员的方式并不能够有效地检测出黑色产业人员。
技术实现思路
基于此,有必要针对目前通过查找关键词的方式来检测黑色产业人员的方式并不能够有效地检测出黑色产业人员的问题,提供一种用户类别检测方法和装置。一种用户类别检测方法,所述方法包括:获取属于预设类别的群组标识集合;从所述群组标识集合 ...
【技术保护点】
一种用户类别检测方法,所述方法包括:获取属于预设类别的群组标识集合;从所述群组标识集合中查找待检测的用户账号所加入群组的群组标识;统计查找到的群组标识的数量,和/或,计算所述待检测的用户账号对应于查找到的群组标识的活跃度;当查找到的群组标识的数量超过第一预设数量和/或所述活跃度超过活跃度阈值时,将所述待检测的用户账号加入属于所述预设类别的用户账号库中。
【技术特征摘要】
1.一种用户类别检测方法,所述方法包括:获取属于预设类别的群组标识集合;从所述群组标识集合中查找待检测的用户账号所加入群组的群组标识;统计查找到的群组标识的数量,和/或,计算所述待检测的用户账号对应于查找到的群组标识的活跃度;当查找到的群组标识的数量超过第一预设数量和/或所述活跃度超过活跃度阈值时,将所述待检测的用户账号加入属于所述预设类别的用户账号库中。2.根据权利要求1所述的方法,其特征在于,所述获取属于预设类别的群组标识集合,包括:获取属于预设类别的样本用户账号;查找所述样本用户账号所加入群组的群组标识所对应的用户账号;当查找到的对应同一群组标识的属于预设类别的用户账号的数量超过第二预设数量时,将所述对应的同一群组标识加入属于预设类别的群组标识集合中。3.根据权利要求2所述的方法,其特征在于,所述获取属于预设类别的群组标识集合,还包括:增大所述第二预设数量的值,并继续查找当前查找到的用户账号所加入群组的群组标识所对应的用户账号,并在当前查找到的对应同一群组标识的属于预设类别的用户账号的数量超过所述第二预设数量时,将当前查找到的用户账号对应的同一群组标识加入属于预设类别的群组标识集合中,直至循环达到预设次数或者直至当前查找到的对应同一群组标识的属于预设类别的用户账号均小于等于所述第二预设数量。4.根据权利要求1所述的方法,其特征在于,所述计算所述待检测的用户账号对应于查找到的群组标识的活跃度,包括:获取所述待检测的用户账号对应于查找到的群组标识的发言数量、发言频率以及发言数量占相应群组标识所对应的发言总量的比重中的至少一种;根据获取的所述发言数量、所述发言频率和所述发言数量占相应群组标识所对应的发言总量的比重中的至少一种计算所述待检测的用户账号对应于查找到的群组标识的活跃度。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:监控所述用户账号库中的用户账号所加入的群组,获得新增的群组标识;当所述新增的群组标识所对应的属于预设类别的用户账号的数量超过第三预设数量时,将所述新增的群组标识加入所述群组标识集合中。6.根据权利要求1-5中任意一项所述的方法,其特征在于,所述预设类别为黑色产业类别。7.一种用户类别检测装置,其...
【专利技术属性】
技术研发人员:陈远斌,陈梦,颜国平,李德春,陈荣,刘飞飞,刘宽,李佳,余传生,
申请(专利权)人:深圳市腾讯计算机系统有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。