异常流量的识别方法和装置、存储介质、电子装置制造方法及图纸

技术编号:34124620 阅读:55 留言:0更新日期:2022-07-14 13:53
本申请公开了一种异常流量的识别方法和装置、存储介质、电子装置。其中,该方法包括:获取目标广告流量,目标广告流量为待识别异常的广告流量;对目标广告流量进行预处理,得到待识别数据,预处理用于将目标广告流量处理为符合预设要求的待识别数据;利用特征提取模型对待识别数据进行特征提取,得到待识别数据的数据特征;调用异常流量检测模型,利用待识别数据的数据特征确定目标广告流量是否为异常流量。本申请解决了相关技术中进行异常检测的效率较低的技术问题。率较低的技术问题。率较低的技术问题。

Identification method and device of abnormal flow, storage medium, electronic device

【技术实现步骤摘要】
异常流量的识别方法和装置、存储介质、电子装置


[0001]本申请涉及互联网领域,具体而言,涉及一种异常流量的识别方法和装置、存储介质、电子装置。

技术介绍

[0002]近年来,随着移动互联网的不断发展和普及,将品牌和产品与消费者紧密相连的互联网广告,这一形式越来越收到广告主的亲赖,数字营销市场的整体规模也迅速扩大,而与网络广告市场繁荣相伴相生的广告欺诈问题已经成为营销广告的顽疾,如何防止互联网的广告欺诈行为也成为了广告主关心的大事之一。广告黑产为了非法获利,通过各种技术操作绕过各种资源限制、提高访问频率,通过脚本、模拟器、群控、借助域名和App变造及众包流量等做法制造大量无效流量,广告欺诈行为日益猖獗。
[0003]目前大多的异常流量检测方法采用基于规则的方法,专家通过对常见的异常流量进行分类,并对每个异常类别进行归纳总结,得到识别每个异常类别的规则,然后通过这些规则在众多流量中去识别与过滤规则内的异常流量。面对不断迭代更新的欺诈行为,这种方法的泛化性不足,且需要人工参与(如每次发生迭代后需要更新规则,将规则生效等),规则阈值的选取会很本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种异常流量的识别方法,其特征在于,包括:获取目标广告流量,其中,所述目标广告流量为待识别异常的广告流量;对所述目标广告流量进行预处理,得到待识别数据,其中,所述预处理用于将所述目标广告流量处理为符合预设要求的所述待识别数据;利用特征提取模型对所述待识别数据进行特征提取,得到所述待识别数据的数据特征;调用异常流量检测模型,利用所述待识别数据的数据特征确定所述目标广告流量是否为异常流量,其中,所述异常流量检测模型是采用半监督学习方法训练得到的。2.根据权利要求1所述的方法,其特征在于,调用异常流量检测模型,利用所述待识别数据的数据特征确定所述目标广告流量是否为异常流量,包括:获取所述异常流量检测模型,其中,所述异常流量检测模型是基于图卷积神经网络和类原型向量的半监督网络进行训练得到的;调用所述异常流量检测模型,利用保存的特征映射层参数与类原型向量对所述待识别数据的数据特征进行识别,以确定所述目标广告流量是否为异常流量。3.根据权利要求2所述的方法,其特征在于,获取异常流量检测模型,包括:获取原始广告流量,其中,所述原始广告流量为用于训练的广告流量;对所述原始广告流量进行预处理,以将所述原始广告流量处理为符合预设要求的广告流量样本;对所述广告流量样本进行特征提取和特征组合统计,以得到所述特征提取模型;构建基于图卷积神经网络和类原型向量的半监督网络模型,并利用所述广告流量样本的数据特征对所述半监督网络模型进行训练,得到所述异常流量检测模型。4.根据权利要求3所述的方法,其特征在于,构建基于图卷积神经网络和类原型向量的半监督网络模型,包括:构建图卷积神经网络GCN:以每个所述广告流量样本作为所述图卷积神经网络GCN中的一个节点,若两个节点的所述广告流量样本的用户标识相同,则建立所述两个节点之间的边并将所述两个节点之间的关联权重设为1;若所述两个节点的所述广告流量样本的用户标识不相同,则不建立所述两个节点之间的边并将所述两个节点之间的关联权重设为0;构建基于所述图卷积神经网络GCN与类原型向量的所述半监督网络模型。5.根据权利要求4所述的方法,其特征在于,构建基于所述图卷积神经网络GCN与类原型向...

【专利技术属性】
技术研发人员:姜娜王硕杨康孙泽懿徐凯波
申请(专利权)人:北京明略软件系统有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1