【技术实现步骤摘要】
一种黑产识别方法、装置、电子设备和存储介质
[0001]本公开涉及计算机
,尤其涉及网络安全技术,具体涉及一种黑产识别方法、装置、电子设备、存储介质和计算机程序产品。
技术介绍
[0002]目前,如黑产经常会使用IP池、肉机、群控等方式批量驱动客户端来对站点发起请求,从而达到爬取网站内容、广告点击欺诈、薅羊毛等目的。其中,黑产即黑色产业,通常是指利用病毒木马等来获取利益的行业。
技术实现思路
[0003]本公开提供了一种黑产识别方法、装置、电子设备、存储介质和计算机程序产品。
[0004]根据本公开的一方面,提供了一种黑产识别方法,包括:
[0005]对目标业务场景下当前统计周期内的业务流量数据进行聚类,得到至少一个目标聚类簇;
[0006]将所述目标聚类簇与参考聚类簇进行匹配;所述参考聚类簇包括已设置的黑产标签;
[0007]基于匹配结果,根据匹配的参考聚类簇的黑产标签确定目标聚类簇的黑产标签;
[0008]根据目标聚类簇及其黑产标签,对当前统计周期后续的实时业务流量进行黑产识别;
[0009]根据所述目标聚类簇的参数更新匹配的参考聚类簇的参数,并进入下一统计周期。
[0010]根据本公开的一方面,提供了一种黑产识别装置,包括:
[0011]聚类模块,用于对目标业务场景下当前统计周期内的业务流量数据进行聚类,得到至少一个目标聚类簇;
[0012]匹配模块,用于将所述目标聚类簇与参考聚类簇进行匹配;所述参考聚类簇包括已设置的 ...
【技术保护点】
【技术特征摘要】
1.一种黑产识别方法,包括:对目标业务场景下当前统计周期内的业务流量数据进行聚类,得到至少一个目标聚类簇;将所述目标聚类簇与参考聚类簇进行匹配;所述参考聚类簇包括已设置的黑产标签;基于匹配结果,根据匹配的参考聚类簇的黑产标签确定目标聚类簇的黑产标签;根据目标聚类簇及其黑产标签,对当前统计周期后续的实时业务流量进行黑产识别;根据所述目标聚类簇的参数更新匹配的参考聚类簇的参数,并进入下一统计周期。2.根据权利要求1所述的方法,其中,对目标业务场景下当前统计周期内的业务流量数据进行聚类,得到至少一个目标聚类簇,包括:按照预设统计维度,对目标业务场景下当前统计周期内的业务流量数据中的接口请求分布进行统计;根据第一聚类方法和所述第一聚类方法对应的聚类参数,对统计出的接口请求分布进行聚类,得到至少一个第一聚类簇;根据第二聚类方法和所述第二聚类方法对应的聚类参数,对统计出的接口请求分布进行聚类,得到至少一个第二聚类簇;对所述第一聚类簇和所述第二聚类簇进行融合,得到至少一个目标聚类簇。3.根据权利要求2所述的方法,其中,所述第一聚类方法为基于划分的聚类方法,所述基于划分的聚类方法对应的聚类参数为聚类中心数量;所述第二聚类方法为基于密度的聚类方法,所述基于密度的聚类方法对应的聚类参数包括聚类搜索半径和聚类簇的最小样本点数。4.根据权利要求3所述的方法,其中,对所述第一聚类簇和所述第二聚类簇进行融合,得到至少一个目标聚类簇,包括:将任一第二聚类簇作为当前聚类簇,若所述当前聚类簇与至少一个第一聚类簇存在交集,则根据存在交集的至少一个第一聚类簇,对所述当前聚类簇中的样本点进行重新聚类,得到至少一个目标聚类簇。5.根据权利要求1所述的方法,其中,基于匹配结果,根据匹配的参考聚类簇的黑产标签确定目标聚类簇的黑产标签,包括:基于匹配结果,将匹配的参考聚类簇的黑产标签赋值给目标聚类簇的黑产标签;其中,所述参考聚类簇的黑产标签是预先对全量历史业务流量数据进行聚类分析确定或人工确定;所述黑产标签的类型包括正常簇、异常簇和离群簇中的至少一种。6.根据权利要求1所述的方法,其中,根据目标聚类簇及其黑产标签,对当前统计周期后续的实时业务流量进行黑产识别,包括:确定所述实时业务流量数据所属的目标聚类簇;根据所述目标聚类簇的黑产标签,确定所述实时业务流量数据是否为黑产流量数据。7.根据权利要求6所述的方法,其中,确定所述实时业务流量数据所属的目标聚类簇,包括:确定所述实时业务流量数据中接口请求分布与每个目标聚类簇的相似度;根据所述相似度,确定所述实时业务流量数据所属的目标聚类簇。8.根据权利要求7所述的方法,其中,确定所述实时业务流量数据中接口请求分布与每
个目标聚类簇的相似度,包括:根据每个目标聚类簇的参数和黑产标签,确定每个目标聚类簇的簇向量;按照预设统计维度,对所述实时业务流量数据中的接口请求分布进行统计;在任一统计维度的接口请求数量达到预设数量阈值,根据该统计维度对应的接口请求分布确定目标向量;根据所述目标向量和每个目标聚类簇的簇向量,确定该统计维度下的接口请求分布与每个目标聚类簇的相似度。9.根据权利要求1所述的方法,其中,将所述目标聚类簇与参考聚类簇进行匹配包括:将所述目标聚类簇的聚类中心与所述参考聚类簇的聚类中心进行相似度匹配。10.根据权利要求1所述的方法,其中,根据所述目标...
【专利技术属性】
技术研发人员:程浩,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。