实时识别异常流量的方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:20926223 阅读:37 留言:0更新日期:2019-04-20 11:50
本发明专利技术公开了一种实时识别异常流量的方法、装置、计算机设备和存储介质,涉及流量监控领域,该方法包括:获取已经接收且存储在数据库中的流量数据;从所述流量数据中获取样本集;将所述样本集分出初始训练样本集;将所述初始训练样本集分别输入逻辑回归LR模型与随机森林RF模型进行训练;接收实时流量数据;将实时流量数据分成第一部分和第二部分;将所述LR模型与RF模型同时投入对第一部分中的实时流量数据的识别中;确定LR模型、RF模型分别对应的第一准确度、第二准确度;将第一准确度和第二准确度中准确度更高的模型配置到第二部分中的实时异常流量的识别中,并进行异常流量的实时识别。该方法提高了实时识别异常流量的准确度。

Real-time identification of abnormal flow: methods, devices, computer equipment and storage media

The invention discloses a method, device, computer equipment and storage medium for real-time identification of abnormal traffic, which relates to the field of traffic monitoring. The method includes: acquiring the traffic data received and stored in the database; acquiring the sample set from the traffic data; dividing the sample set into the initial training sample set; and inputting the initial training sample set into the logic respectively. To train LR model and random forest RF model; to receive real-time traffic data; to divide real-time traffic data into the first part and the second part; to put the LR model and RF model into the identification of real-time traffic data in the first part at the same time; to determine the first accuracy and the second accuracy of LR model and RF model respectively; and to make the first accuracy and the second accuracy medium accuracy. The model with higher degree is allocated to the real-time anomalous traffic identification in the second part, and the real-time anomalous traffic identification is carried out. This method improves the accuracy of real-time anomalous traffic identification.

【技术实现步骤摘要】
实时识别异常流量的方法、装置、计算机设备和存储介质
本专利技术涉及流量监控领域,特别是涉及实时识别异常流量的方法、装置、计算机设备和存储介质。
技术介绍
随着互联网技术的迅速发展,网络中流量数据的流通传递着各种各样的信息,为人们带来了极大的便利。但同时,有着许多不法份子通过重复请求、访问、下载等操作产生大量流量,从中进行获利。而这种恶意发送流量数据的行为将对服务器造成极大的负担,严重时甚至导致服务器瘫痪,对其他合法用户节点造成不便及损失。因此是否能够有效对异常流量进行限制、封锁,取决于服务器是否能够准确、及时、有效地识别出异常流量数据。
技术实现思路
基于此,为解决相关技术中如何实时识别异常流量的技术问题,本专利技术提供了一种实时识别异常流量的方法、装置、计算机设备和存储介质。第一方面,提供了一种实时识别异常流量的方法,包括:获取已经接收、且存储在数据库中的流量数据;从所述流量数据中获取样本集,其中,每个所述流量数据为一个样本,每个所述流量数据被贴有是否是异常流量的标签;将所述样本集分出初始训练样本集;将所述初始训练样本集分别输入逻辑回归LR模型与随机森林RF模型进行训练,其中,根据逻辑本文档来自技高网...

【技术保护点】
1.一种实时识别异常流量的方法,其特征在于,包括:获取已经接收、且存储在数据库中的流量数据;从所述流量数据中获取样本集,其中,每个所述流量数据为一个样本,每个所述流量数据被贴有是否是异常流量的标签;将所述样本集分出初始训练样本集;将所述初始训练样本集分别输入逻辑回归LR模型与随机森林RF模型进行训练,其中,根据逻辑回归LR模型与随机森林RF模型的输出结果判定所述初始训练样本集的每个样本是否是异常流量,如果判定结果与样本的标签一致,则判定结果准确,判定结果准确的样本数占所述初始训练样本集中的样本总数的比为准确度,在所述准确度没有均达到预定阈值时,不断对所述逻辑回归LR模型与随机森林RF模型进行训...

【技术特征摘要】
1.一种实时识别异常流量的方法,其特征在于,包括:获取已经接收、且存储在数据库中的流量数据;从所述流量数据中获取样本集,其中,每个所述流量数据为一个样本,每个所述流量数据被贴有是否是异常流量的标签;将所述样本集分出初始训练样本集;将所述初始训练样本集分别输入逻辑回归LR模型与随机森林RF模型进行训练,其中,根据逻辑回归LR模型与随机森林RF模型的输出结果判定所述初始训练样本集的每个样本是否是异常流量,如果判定结果与样本的标签一致,则判定结果准确,判定结果准确的样本数占所述初始训练样本集中的样本总数的比为准确度,在所述准确度没有均达到预定阈值时,不断对所述逻辑回归LR模型与随机森林RF模型进行训练,直到所述准确度均达到预定阈值;接收实时流量数据;将所述实时流量数据分成第一部分和第二部分,其中,所述第一部分被贴有是否是异常流量的标签;将所述LR模型与RF模型同时投入对所述第一部分中的实时流量数据的识别中;确定LR模型的判定结果与贴有的标签一致的实时流量数据数占第一部分中的所有实时流量数据的占比,作为第一准确度;确定RF模型的判定结果与贴有的标签一致的实时流量数据数占第一部分中的所有实时流量数据的占比,作为第二准确度;将第一准确度和第二准确度中准确度更高的模型配置到第二部分中的实时异常流量的识别中,并进行异常流量的实时识别。2.根据权利要求1的方法,其特征在于,所述获取样本集,包括:将所述流量数据输入离线异常流量识别模型,由异常流量识别模型输出正负样本,所述正样本为正常流量样本,打上正常流量标签;所述负样本为异常流量样本,打上异常流量标签;将所有所述正负样本进行数据清洗,其中清洗过的样本组成所述样本集。3.根据权利要求2的方法,其特征在于,将所述正负样本进行数据清洗,包括:对格式转换失败、部分格式转换的数据进行删除。4.根据权利要求1所述的方法,其特征在于,所述将所述样本集分出初始训练样本集包括:用所述样本集中初始训练样本集以外的样本组成对抗训练样本集。5.根据权利要求1的方法,其特征在于,根据逻辑回归LR模型的输出结果判定所述初始训练样本集的每个样本是否是异常流量包括:将逻辑回归LR模型输出的异常流量风险分数与预定风险分数阈值进行比较,...

【专利技术属性】
技术研发人员:于洋马宁孙家棣
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1