基于半监督谱聚类和集成SVM的流量检测方法及系统技术方案

技术编号:31449470 阅读:37 留言:0更新日期:2021-12-18 11:11
本发明专利技术提供一种基于半监督谱聚类和集成SVM的流量检测方法及系统,所述检测方法首先将未知网络流量和已知网络流量区分开来。因此,首先解决的是未知网络流量的筛选问题,通过半监督谱聚类方法实现对未知网络流量的筛选,提高了未知网络流量筛选的效率;其次建立基于SVM的集成分类器,避开了从归纳到演绎的传统过程,大大简化了分类与回归问题,同时具有很好的鲁棒性,在检测未知网络流量攻击类型方面具有较高的准确率和较低的误报率,实现对未知网络流量进行攻击类型的精准检测。未知网络流量进行攻击类型的精准检测。未知网络流量进行攻击类型的精准检测。

【技术实现步骤摘要】
基于半监督谱聚类和集成SVM的流量检测方法及系统


[0001]本专利技术属于未知流量攻击类型检测
,特别涉及一种基于半监督谱聚类和集成SVM的流量检测方法及系统。

技术介绍

[0002]网络流量数据来源广、层次多、差异大、纬度高、内在关系错综复杂,未知恶意流量隐藏的比较深;同时应用传统的统计方法不能高效率检测、分析和处理。在如此复杂的网络环境下,如何将未知流量筛选出来,并实现对未知流量攻击类型的高准确性检测,降低检测误报率是目前急需解决的技术问题。

技术实现思路

[0003]为了解决现有技术中存在的问题,本专利技术提供一种基于半监督谱聚类和集成SVM的流量检测方法和系统。
[0004]本专利技术其中一个技术方案提供一种基于半监督谱聚类和集成SVM的流量检测方法,所述检测方法包括如下步骤:
[0005]构建综合数据集;
[0006]利用半监督谱聚类方法从综合数据集内筛选出未知网络流量;
[0007]利用集成学习方法对未知网络流量的攻击类型进行检测。
[0008]优选地,所述构建综合数据本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于半监督谱聚类和集成SVM的流量检测方法,其特征在于,所述检测方法包括如下步骤:构建综合数据集;利用半监督谱聚类方法从综合数据集内筛选出未知网络流量;利用集成学习方法对未知网络流量的攻击类型进行检测。2.根据权利要求1所述的基于半监督谱聚类和集成SVM的流量检测方法,其特征在于,所述构建综合数据集包括如下步骤:获取已知网络流量的数据集,去掉数据集中的标签信息,形成无标签数据集;将无标签数据集与未知网络流量混合形成无标签的综合数据集。3.根据权利要求2所述的基于半监督谱聚类和集成SVM的流量检测方法,其特征在于,所述利用半监督谱聚类方法从综合数据集内筛选出未知网络流量包括如下步骤:计算综合数据集中两点之间的欧氏距离;修改距离矩阵D;构造矩阵S;构造矩阵其中,T为对角矩阵,i为矩阵S的行角标,j为矩阵S的列角标,i、j=1至n;经过谱聚类过程获得2个类;对已知网络流量的数据集进行聚类,分别计算2个类的聚类中心与已知网络流量的数据集中每个类聚类中心的平均距离,距离已知网络流量的数据集的平均距离小的类为已知网络流量,另一类为未知网络流量。4.根据权利要求1所述的基于半监督谱聚类和集成SVM的流量检测方法,其特征在于,所述利用集成学习方法对未知网络流量的攻击类型进行检测包括如下步骤:获取训练样本集合M,进行多轮训练,获得多个弱分类器;多个弱分类器的加权求和获取强分类器,将未知网络流量输入到强分类器内,输出攻击类型。5.根据权利要求4所述的基于半监督谱聚类和集成SVM的流量检测方法,其特征在于,所述进行多轮训练,获得多个弱分类器具体为从训练样本集合M开始训练第一弱分类器,每完成一轮训练后,都从本轮训练的样本集合中挑选出下一轮训练过程的训练数据集进行训练获得多个弱分类器。6.根据权利要求5所述的基于半监督谱...

【专利技术属性】
技术研发人员:龙春魏金侠万巍赵静杜冠瑶杨帆
申请(专利权)人:中国科学院计算机网络信息中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1