The embodiment of the invention discloses a method and apparatus for measuring the flow, the method includes: to include log flow detection feature, obtain each detected flow characteristics; according to the characteristics, determine each detected feature vector flow; using the default clustering algorithm, clustering for the feature vector; respectively using pre classification algorithm in each classification algorithm and training data set, the classification of clustering results; according to the results of classification, each classification algorithm of preset training data and default decision tree algorithm, the detection of each feature vector corresponding to the detected flow is abnormal traffic. With the embodiment of the invention, the accuracy rate of abnormal flow detection is improved.
【技术实现步骤摘要】
一种流量检测方法及装置
本专利技术涉及异常流量检测领域,特别涉及一种流量检测方法及装置。
技术介绍
随着互联网技术的发展,网络应用得到了极大的普及,不明计算机的接入可能会造成网络异常流量的发生。异常流量是造成网络安全的问题之一,它是指对正常网络使用造成不良影响,对目标主机进行控制与破坏的流量模式,常见的形式有木马病毒、网络蠕虫和分布式拒绝服务攻击等。因此,快速从网络中检测出异常流量对于保护网络安全是非常重要的。现有的异常流量检测是通过基于监督学习的机器学习算法进行检测的,具体过程是:采用预先收集的训练数据集(黑名单的流量和白名单的流量)和分类算法对待检测流量进行训练,得到待检测流量的分类结果,再通过分类算法获得待检测流量属于异常流量的概率,根据预测概率检测待检测流量是否为异常流量。基于监督学习主要是通过广泛的学习,因此训练数据集种类的完备直接影响到训练的结果。当未知流量数据出现的时候,因为没有相应的训练数据集进行学习,因而不能准确的将未知流量进行分类,导致异常流量检测准确率较低。
技术实现思路
本专利技术实施例的目的在于提供一种流量检测方法及装置,以提高异常流量检测的准确率。为达到上述目的,本专利技术实施例公开了一种流量检测方法,所述方法包括:针对包含待检测流量的日志进行特征处理,获得每一条待检测流量的特征;根据所述特征,确定每一条待检测流量的特征向量;利用预设聚类算法,对所述特征向量进行聚类;分别利用预设分类算法中的每一个分类算法和预设训练数据集,对聚类结果进行分类;根据每一个分类算法的分类结果、预设训练数据集以及预设决策树算法,检测每一个特征向量对应的待检 ...
【技术保护点】
一种流量检测方法,其特征在于,所述方法包括:针对包含待检测流量的日志进行特征处理,获得每一条待检测流量的特征;根据所述特征,确定每一条待检测流量的特征向量;利用预设聚类算法,对所述特征向量进行聚类;分别利用预设分类算法中的每一个分类算法和预设训练数据集,对聚类结果进行分类;根据每一个分类算法的分类结果、预设训练数据集以及预设决策树算法,检测每一个特征向量对应的待检测流量是否为异常流量。
【技术特征摘要】
1.一种流量检测方法,其特征在于,所述方法包括:针对包含待检测流量的日志进行特征处理,获得每一条待检测流量的特征;根据所述特征,确定每一条待检测流量的特征向量;利用预设聚类算法,对所述特征向量进行聚类;分别利用预设分类算法中的每一个分类算法和预设训练数据集,对聚类结果进行分类;根据每一个分类算法的分类结果、预设训练数据集以及预设决策树算法,检测每一个特征向量对应的待检测流量是否为异常流量。2.根据权利要求1所述的方法,其特征在于,所述预设聚类算法为:K-means算法。3.根据权利要求1所述的方法,其特征在于,所述预设分类算法,包括以下算法中一种或几种:逻辑回归算法、支持向量机算法、随机森林算法。4.根据权利要求1所述的方法,其特征在于,所述预设决策树算法为:梯度迭代决策树算法。5.根据权利要求1所述的方法,其特征在于,在所述根据所述特征,确定每一条待检测流量的特征向量之前,所述方法还包括:对获得每一条待检测流量的特征进行预设处理,所述预设处理包括:预处理、离散化处理、归一化处理和插值处理中的一种或几种;所述根据所述特征,确定每一条待检测流量的特征向量,包括:根据预设处理后的特征,确定每一条待检测流量的特征向量。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据检测结果对所述每一个分类算法的分类结果进行验证;如果验证错误,更改该分类算法对聚类结果进行分类时所使...
【专利技术属性】
技术研发人员:陈永环,张迪,张晓明,赵冲翔,
申请(专利权)人:北京奇艺世纪科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。