识别批量注册账号群的方法及装置制造方法及图纸

技术编号:22298423 阅读:55 留言:0更新日期:2019-10-15 06:59
本发明专利技术涉及大数据风控技术领域,尤其涉及识别批量注册账号群的方法及装置。所述方法包括:获取多个账号中每个所述账号的网络协议地址、注册时间、注册来源、操作行为以及所述操作行为对应的操作时间;确定所述多个账号中每两个账号之间的相似度;根据每两个账号之间的相似度,对所述多个账号进行基于密度的聚类;将聚类后得到的账号群中账号数量大于批量注册阈值的账号群确定为批量注册账号群。本发明专利技术通过上述过程实现了对账号之间的同步性进行分析,即便网络黑产对设备标识进行篡改,仍然能够准确地识别出多个账号中哪些账号属于批量注册账号,提高了对批量注册账号的识别准确性。

Method and Device for Identifying Batch Registered Account Groups

【技术实现步骤摘要】
识别批量注册账号群的方法及装置
本专利技术涉及大数据风控
,尤其涉及识别批量注册账号群的方法及装置。
技术介绍
网络黑产是指以互联网为媒介、以网络技术为主要手段,对计算机信息系统安全和网络空间管理秩序造成威胁的非法行为。在直播平台上,网络黑产为了达到其目的采用计算机程序在短时间内批量地注册账号,这种行为被叫做批量注册。通过批量注册得到的批量注册账号群通常会被用于非法行为。因此,为了保证互联网安全,需要准确地识别出批量注册账号群。由于批量注册账号群通常会公用有限的设备资源,这就不可避免地会出现多个账号公用一台设备的现象,因此,现有技术通过识别多个账号是否公用一台设备来确定多个账号是否属于批量注册账号群。然而,采用上述识别方法如果网络黑产对设备标识进行篡改,降低账号之间的设备重用率,将难以发现批量注册账号群,存在对批量注册账号的识别准确性低的问题。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的识别批量注册账号群的方法及装置。依据本专利技术的第一个方面,本专利技术提供一种识别批量注册账号群的方法,所述方法包括:获取多个账号中每个所述账号的网络协议地址、注册时间、注册来源、操作行为以及所述操作行为对应的操作时间;确定所述多个账号中每两个账号之间的相似度;根据每两个账号之间的相似度,对所述多个账号进行基于密度的聚类;将聚类后得到的账号群中账号数量大于批量注册阈值的账号群确定为批量注册账号群;其中,确定两个所述账号之间的相似度,包括:基于两个所述账号的网络协议地址进行网络协议地址相似度计算,获得第一相似度;基于两个所述账号的注册时间进行注册时间相似度计算,获得第二相似度;基于两个所述账号的注册来源进行注册来源相似度计算,获得第三相似度;基于两个所述账号的操作行为以及所述操作行为对应的操作时间进行操作行为相似度计算,获得第四相似度;基于所述第一相似度、第二相似度、第三相似度、第四相似度以及与各个相似度对应的权重系数,确定两个所述账号之间的相似度。优选的,所述基于两个所述账号的网络协议地址进行网络协议地址相似度计算,获得第一相似度,包括以下公式:其中,ip-sim(u,v)为所述第一相似度,IPu为两个所述账号中的第一账号的网络协议地址,IPv为两个所述账号中的第二账号的网络协议地址。优选的,所述基于两个所述账号的注册时间进行注册时间相似度计算,获得第二相似度,包括以下公式:其中,time-sim(u,v)为所述第二相似度,tu为两个所述账号中的第一账号的注册时间,tv为两个所述账号中的第二账号的注册时间。优选的,所述基于两个所述账号的注册来源进行注册来源相似度计算,获得第三相似度,包括以下公式:src-sim(u,v)=I(srcu=srcv)其中,src-sim(u,v)为所述第三相似度,srcu为两个所述账号中的第一账号的注册来源,srcv为两个所述账号中的第二账号的注册来源,I为示性函数,I(srcu=srcv)表示若srcu=srcv则I取1,否则I取0。优选的,所述基于两个所述账号的操作行为以及所述操作行为对应的操作时间进行操作行为相似度计算,获得第四相似度,包括以下公式:其中,behavior-sim(u,v)为所述第四相似度,Δti为操作时间差序列,所述操作时间差序列包含两个所述账号在相同操作行为下操作时间差的最小值,s为所述操作时间差序列的总长度。依据本专利技术的第二个方面,提供了一种识别批量注册账号群的装置,所述装置包括:获取模块,用于获取多个账号中每个所述账号的网络协议地址、注册时间、注册来源、操作行为以及所述操作行为对应的操作时间;第一确定模块,用于确定所述多个账号中每两个账号之间的相似度;聚类模块,用于根据每两个账号之间的相似度,对所述多个账号进行基于密度的聚类;第二确定模块,用于将聚类后得到的账号群中账号数量大于批量注册阈值的账号群确定为批量注册账号群;其中,所述第一确定模块,包括:第一获得单元,用于基于两个所述账号的网络协议地址进行网络协议地址相似度计算,获得第一相似度;第二获得单元,用于基于两个所述账号的注册时间进行注册时间相似度计算,获得第二相似度;第三获得单元,用于基于两个所述账号的注册来源进行注册来源相似度计算,获得第三相似度;第四获得单元,用于基于两个所述账号的操作行为以及所述操作行为对应的操作时间进行操作行为相似度计算,获得第四相似度;确定单元,用于基于所述第一相似度、第二相似度、第三相似度、第四相似度以及与各个相似度对应的权重系数,确定两个所述账号之间的相似度。优选的,所述第一获得单元,包括以下公式:其中,ip-sim(u,v)为所述第一相似度,IPu为两个所述账号中的第一账号的网络协议地址,IPv为两个所述账号中的第二账号的网络协议地址。优选的,所述第二单元,包括以下公式:其中,time-sim(u,v)为所述第二相似度,tu为两个所述账号中的第一账号的注册时间,tv为两个所述账号中的第二账号的注册时间。依据本专利技术的第三个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如前述第一个方面中的方法步骤。依据本专利技术的第四个方面,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如前述第一个方面中的方法步骤。根据本专利技术的识别批量注册账号群的方法及装置,通过获取多个账号中每个账号的网络协议地址、注册时间、注册来源、操作行为以及操作行为对应的操作时间。接着,确定多个账号中每两个账号之间的相似度。再,根据每两个账号之间的相似度,对多个账号进行基于密度的聚类。最后,将聚类后得到的账号群中账号数量大于批量注册阈值的账号群确定为批量注册账号群。其中,确定两个账号之间的相似度的过程,包括:基于两个账号的网络协议地址进行网络协议地址相似度计算,获得第一相似度。基于两个账号的注册时间进行注册时间相似度计算,获得第二相似度。基于两个账号的注册来源进行注册来源相似度计算,获得第三相似度。基于两个账号的操作行为以及操作行为对应的操作时间进行操作行为相似度计算,获得第四相似度。基于第一相似度、第二相似度、第三相似度、第四相似度以及与各个相似度对应的权重系数,确定两个账号之间的相似度。通过上述过程实现了对账号之间的同步性进行分析,即便网络黑产对设备标识进行篡改,仍然能够准确地识别出多个账号中哪些账号属于批量注册账号,提高了对批量注册账号的识别准确性。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考图形表示相同的部件。在附图中:图1示出了本专利技术第一实施例中识别批量注册账号群的方法的流程图;图2示出了本专利技术第一实施例中步骤102的流程图;图3示出了本专利技术第二实施例中识别批量注册账号群的装置的结构示意图;图4示出了本专利技术第四实施例中计算机本文档来自技高网...

【技术保护点】
1.一种识别批量注册账号群的方法,其特征在于,所述方法包括:获取多个账号中每个所述账号的网络协议地址、注册时间、注册来源、操作行为以及所述操作行为对应的操作时间;确定所述多个账号中每两个账号之间的相似度;根据每两个账号之间的相似度,对所述多个账号进行基于密度的聚类;将聚类后得到的账号群中账号数量大于批量注册阈值的账号群确定为批量注册账号群;其中,确定两个所述账号之间的相似度,包括:基于两个所述账号的网络协议地址进行网络协议地址相似度计算,获得第一相似度;基于两个所述账号的注册时间进行注册时间相似度计算,获得第二相似度;基于两个所述账号的注册来源进行注册来源相似度计算,获得第三相似度;基于两个所述账号的操作行为以及所述操作行为对应的操作时间进行操作行为相似度计算,获得第四相似度;基于所述第一相似度、第二相似度、第三相似度、第四相似度以及与各个相似度对应的权重系数,确定两个所述账号之间的相似度。

【技术特征摘要】
1.一种识别批量注册账号群的方法,其特征在于,所述方法包括:获取多个账号中每个所述账号的网络协议地址、注册时间、注册来源、操作行为以及所述操作行为对应的操作时间;确定所述多个账号中每两个账号之间的相似度;根据每两个账号之间的相似度,对所述多个账号进行基于密度的聚类;将聚类后得到的账号群中账号数量大于批量注册阈值的账号群确定为批量注册账号群;其中,确定两个所述账号之间的相似度,包括:基于两个所述账号的网络协议地址进行网络协议地址相似度计算,获得第一相似度;基于两个所述账号的注册时间进行注册时间相似度计算,获得第二相似度;基于两个所述账号的注册来源进行注册来源相似度计算,获得第三相似度;基于两个所述账号的操作行为以及所述操作行为对应的操作时间进行操作行为相似度计算,获得第四相似度;基于所述第一相似度、第二相似度、第三相似度、第四相似度以及与各个相似度对应的权重系数,确定两个所述账号之间的相似度。2.如权利要求1所述的方法,其特征在于,所述基于两个所述账号的网络协议地址进行网络协议地址相似度计算,获得第一相似度,包括以下公式:其中,ip-sim(u,v)为所述第一相似度,IPu为两个所述账号中的第一账号的网络协议地址,IPv为两个所述账号中的第二账号的网络协议地址。3.如权利要求1所述的方法,其特征在于,所述基于两个所述账号的注册时间进行注册时间相似度计算,获得第二相似度,包括以下公式:其中,time-sim(u,v)为所述第二相似度,tu为两个所述账号中的第一账号的注册时间,tv为两个所述账号中的第二账号的注册时间。4.如权利要求1所述的方法,其特征在于,所述基于两个所述账号的注册来源进行注册来源相似度计算,获得第三相似度,包括以下公式:src-sim(u,v)=I(srcu=srcv)其中,src-sim(u,v)为所述第三相似度,srcu为两个所述账号中的第一账号的注册来源,srcv为两个所述账号中的第二账号的注册来源,I为示性函数,I(srcu=srcv)表示若srcu=srcv则I取1,否则I取0。5.如权利要求1所述的方法,其特征在于,所述基于两个所述账号的操作行为以及所述操作行为对应的操作时间进行操作行为相似度计算,获得第四相...

【专利技术属性】
技术研发人员:王璐
申请(专利权)人:武汉斗鱼网络科技有限公司
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1