【技术实现步骤摘要】
流量检测方法、装置及电子设备
[0001]本公开涉及数据处理
,尤其涉及互联网技术、机器学习
,具体涉及一种流量检测方法、装置及电子设备。
技术介绍
[0002]近年来互联网技术得到了高速发展,为了维护互联网业务的健康发展,需要针对互联网业务进行异常流量的检测。
[0003]目前,通常是基于策略引擎配置维度统计类规则进行业务的异常流量检测。
技术实现思路
[0004]本公开提供了一种流量检测方法、装置及电子设备。
[0005]根据本公开的第一方面,提供了一种流量检测方法,包括:
[0006]获取第一用户在目标业务上的第一流量时序信息;
[0007]确定所述第一流量时序信息和预先获取的目标数据中第二用户在M个业务上的N个第二流量时序信息之间的相关性数据,所述目标数据还包括所述N个第二流量时序信息所属的K个分类集合,所述K个分类集合是按照第二流量时序信息的邻域半径和邻域内数量阈值对所述N个第二流量时序信息进行分簇得到的,所述M个业务包括所述目标业务,M为正整数,N和K均
【技术保护点】
【技术特征摘要】
1.一种流量检测方法,包括:获取第一用户在目标业务上的第一流量时序信息;确定所述第一流量时序信息和预先获取的目标数据中第二用户在M个业务上的N个第二流量时序信息之间的相关性数据,所述目标数据还包括所述N个第二流量时序信息所属的K个分类集合,所述K个分类集合是按照第二流量时序信息的邻域半径和邻域内数量阈值对所述N个第二流量时序信息进行分簇得到的,所述M个业务包括所述目标业务,M为正整数,N和K均为大于1的整数;基于所述相关性数据和所述K个分类集合,确定所述第一流量时序信息所属的分类集合,得到所述第一用户的流量类别,所述流量类别指示所述第一用户的流量是否为异常流量。2.根据权利要求1所述的方法,其中,所述获取第一用户在目标业务上的第一流量时序信息,包括以下至少一项:获取所述目标业务的第一线上日志数据,对所述第一线上日志数据进行统计,得到第一用户在目标业务上的第一流量时序信息;获取所述目标业务的风险流量数据,对所述风险流量数据进行统计,得到第一用户在目标业务上的第一流量时序信息,所述风险流量数据是通过所述目标业务下配置的风险流量特征集从所述目标业务的线上日志数据中检测出来的风险流量。3.根据权利要求1所述的方法,其中,针对一个第二用户,所述第二用户的第二流量时序信息的数量包括至少两个,所述第二用户的至少两个第二流量时序信息是基于所述第二用户的标识聚合不同时间维度上的流量得到的,一个时间维度对应一个第二流量时序信息,所述第一用户的第一流量时序信息的数量与所述第二用户的第二流量时序信息的数量相同,且至少两个第一流量时序信息与至少两个第二流量时序信息在时间维度上一一对应。4.根据权利要求3所述的方法,其中,所述基于所述相关性数据和所述K个分类集合,确定所述第一流量时序信息所属的分类集合,得到所述第一用户的流量类别,包括:针对每个时间维度,基于所述时间维度下的第一流量时序信息和第二流量时序信息之间的相关性数据和所述K个分类集合中所述时间维度下的分类集合,确定所述时间维度下所述第一流量时序信息所属的分类集合;基于各个时间维度下所述第一流量时序信息所属的分类集合以及分类集合的类别属性,确定所述第一用户的流量类别。5.根据权利要求1所述的方法,其中,所述K个分类集合包括第一目标分类集合,所述第一目标分类集合为对所述N个第二流量时序信息进行分簇时未形成簇的分类集合,所述基于所述相关性数据和所述K个分类集合,确定所述第一流量时序信息所属的分类集合,得到所述第一用户的流量类别之后,所述方法还包括:获取所述M个业务上的第二线上日志数据;对所述第二线上日志数据进行统计,得到第三用户在所述M个业务上的第三流量时序信息;在基于所述第三流量时序信息和所述N个第二流量时序信息确定所述第三流量时序信息所属的分类集合为所述第一目标分类集合的情况下,确定所述第一目标分类集合下的第
二流量时序信息和所述第三流量时序信息之间共有的第一流量特征;将所述第一流量特征添加至所述M个业务下配置的风险流量特征集中。6.根据权利要求1所述的方法,还包括:获取所述M个业务的异常用户和所述异常用户的第二流量特征;对所述M个业务上的第三线上日志数据进行统计,得到第四用户在所述M个业务上的第四流量时序信息;从所述第四流量时序信息中筛选出与所述第二流量特征匹配的目标流量时序信息;对所述目标流量时序信息进行分簇,得到第二目标分类集合,所述第二目标分类集合为对所述目标流量时序信息进行分簇时形成簇的分类集合,所述第二目标分类集合包括所述异常用户的流量时序信息;确定所述第二目标分类集合下的流量时序信息之间共有的第三流量特征;将所述第三流量特征添加至所述M个业务下配置的风险流量特征集中。7.一种流量检测装置,包括:第一获取模块,用于获取第一用户在目标业务上的第一流量时序信息;第一确定模块,用于确定所述第一流量时序信息和预先获取的目标数据中第二用户在M个业务上的N个第二流量时序信息之间的相关性数据,所述目标数据还包括所述N个第二流量时序信息所属的K个分类集合,所述K个分...
【专利技术属性】
技术研发人员:李任鹏,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。