【技术实现步骤摘要】
异常流量的检测方法和装置、电子设备、存储介质
[0001]本申请涉及计算机领域,尤其涉及一种异常流量的检测方法和装置、电子设备、存储介质。
技术介绍
[0002]广告流量欺诈发展快速,其目的是通过浏览、点击或下载广告,使广告发布者获利或给广告主造成损失。近年来,随着智能手机的飞速普及,大多数广告业务都将重点转向了移动平台。如今,移动平台上的应用内广告是广告欺诈的核心聚集地。恶意用户或团体通过浏览、点击、或下载等方式对广告发动攻击,人为地提高特定广告的曝光率、点击率、下载率、转化率等。现有工业界往往会共享IP的黑名单或用户ID的黑名单,但黑名单往往是随时间变化的,在受到激励时,某IP或用户ID会发展成为黑名单,当激励消失时,黑名单有可能会发展成为正常用户。
[0003]相关技术中的异常流量检测方法大多基于专家规则和机器学习预测模型。基于专家规则的方法依靠业务经验和专家规则定义相关的规则模板进行过滤,强烈依赖专家规则和业务背景,且黑产行业的作弊规则千遍万化,不同领域的流量作弊方法各异,作弊方式层出不穷,使得基于专家规则的 ...
【技术保护点】
【技术特征摘要】
1.一种异常流量的检测方法,其特征在于,包括:获取目标网络设备的流量序列,其中,所述流量序列中按照时间顺序保存有所述目标网络设备对广告业务的访问行为所产生的多个流量数据;根据所述流量序列构建多个时段中每个时段的时段网络,其中,所述时段网络包括多个节点和节点之间的边,每个节点用于表示所述目标网络设备在一个访问时刻对广告业务的访问行为,两个节点之间的边用于表示所述两个节点所表示的访问行为之间的关联关系;从多个所述时段网络中提取网络特征和时序特征,其中,所述网络特征用于通过向量的形式表示所述时段网络的内部特征;根据所述时段网络的网络特征和时序特征,获取检测结果,其中,所述检测结果用于表示所述目标网络设备是否异常。2.根据权利要求1所述的方法,其特征在于,获取目标网络设备的流量序列,包括:获取所述广告业务的流量日志,其中,所述流量日志中保存有多个网络设备对所述广告业务的访问行为所产生的流量数据,所述多个网络设备包括所述目标网络设备;从所述流量日志中提取所述目标网络设备的流量序列。3.根据权利要求2所述的方法,其特征在于,从所述流量日志中提取所述目标网络设备的流量序列,包括:获取所述流量日志中所有数据的来源IP地址;从所有流量数据中获取来源IP地址不在IP地址集合内的第一流量数据,其中,所述IP地址集合中保存有预设的需要过滤的公有IP地址;从所有第一流量数据中获取不存在关键字段缺失的第二流量数据,其中,所述关键字段缺失包括所述第一流量数据中不存在关键字段或关键字段的数据为无效数据,所述关键字段的数据为所述时段网络需要使用的属性数据;对所有所述第二流量数据进行字段缺失值的填充,得到第三流量数据,其中,任意两个所述第三流量数据的数据长度相同;利用所有所述第三流量数据中与所述目标网络设备匹配的流量数据,构建所述目标网络设备的流量序列,其中,与所述目标网络设备匹配的流量数据表示所携带的IP地址与所述目标网络设备的IP地址相同或所携带的用户帐号与所述目标网络设备上使用的用户帐号相同。4.根据权利要求1所述的方法,其特征在于,根据所述流量序列构建多个时段中每个时段的时段网络,包括按照如下方式构建每个时段的时段网络:确定当前时段的起始时间和结束时间;查找所述流量序列中时间戳不早于所述起始时间且距离所述起始时间最近的第四流量数据、时间戳不晚于所述结束时间且距离所述起始时间最近的第五流量数据;将所述第四流量数据、所述第五流量数据、以及所述流量序列中位于所述第四流量数据与所述第五流量数据的第六流量数据,作为所述当前时段的时段流量数据,来构建所述当前时段的时段网络,所述当前时段的时段网络中的节点数量...
【专利技术属性】
技术研发人员:王硕,李霞,杨康,王同乐,
申请(专利权)人:上海明略人工智能集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。