System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及电数字数据处理,尤其涉及一种基于半监督学习的流量识别方法及系统。
技术介绍
1、随着信息技术的不断发展和普及,信息产业在现代社会中扮演着日益重要的角色。流量识别是信息产业中网络安全领域的一个重要组成部分。现如今,基于原始流量的方法是目前流量识别的主要方法,主要通过卷积神经网络提取并学习特征,但此种方法存在一些弊端,首先是需要大量已标记的数据进行模型训练,通过监督的方式来实现流量识别,但是,数据的标记需要大量的人力资源,且已标记的公开数据集有限,从而导致训练出来的模型容易出现过拟合现象,另外深度神经网络需要固定尺寸的输入,因此原始流量数据必须转换成相同大小的图像。然而,这可能会导致部分流量信息丢失,并且裁剪和填充操作也会损失流量的结构信息。
技术实现思路
1、为了解决上述问题,本专利技术提出一种基于半监督学习的流量识别方法及系统,通过引入自注意力机制来提高模型在处理复杂任务时的性能和效果;通过使用残差网络(resnet)代替卷积神经网络来提取流量原始特征及统计特征以便解决模型训练过程中出现的退化现象,从而提取到更细节的特征。
2、为了实现上述目的,本专利技术通过如下的技术方案来实现:
3、一种基于半监督学习的流量识别方法,所述方法包括:
4、分别采集正常数据流量和恶意数据流量,并进行数据预处理;
5、将预处理后的数据进行图像转换,生成灰度图像,转换后生成的图像数据集分为两组,一组为不带标记的数据,另一组为带有标记的数据;<
...【技术保护点】
1.一种基于半监督学习的流量识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的一种基于半监督学习的流量识别方法,其特征在于,所述正常数据流量和恶意数据流量通过IMTH2019数据集和CIC-IDS2017数据集进行采集,所述CIC-IDS2017数据集中的恶意数据流量类型包括FTP攻击、SSH攻击和Dos攻击等。
3.根据权利要求2所述的一种基于半监督学习的流量识别方法,其特征在于,所述IMTH2019数据集和CIC-IDS2017数据集中的数据以pcap文件的形式保存,所述pcap文件中的每一条代表一个数据包;
4.根据权利要求1所述的一种基于半监督学习的流量识别方法,其特征在于,将数据预处理后的数据进行图像转换,生成灰度图像,具体包括:目标图像表示为A*B,像素点用P来表示,关系为:
5.根据权利要求1所述的一种基于半监督学习的流量识别方法,其特征在于,所述构建基于残差网络的流量识别模型,具体包括:将所述模型数据集按照5:1的比例划分为训练集和测试集,并放入残差网络中进行预训练,残差网络中每个残差块通过残差传递机制直
6.根据权利要求1所述的一种基于半监督学习的流量识别方法,其特征在于,所述使用粒子群优化算法寻找全局最优解,具体包括:通过粒子的位置信息计算适应度值,然后更新每个粒子的最佳位置和整个群体的全局最佳位置,公式为:
7.根据权利要求1所述的一种基于半监督学习的流量识别方法,其特征在于,所述使用剩余带有标记的数据集对所述流量识别模型进行再训练,具体包括:
8.基于权利要求1-7任一项所述的一种基于半监督学习的流量识别方法的系统,其特征在于,所述系统包括:
9.一种基于半监督学习的流量识别设备,其特征在于,所述设备包括:
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的一种基于半监督学习的流量识别方法。
...【技术特征摘要】
1.一种基于半监督学习的流量识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的一种基于半监督学习的流量识别方法,其特征在于,所述正常数据流量和恶意数据流量通过imth2019数据集和cic-ids2017数据集进行采集,所述cic-ids2017数据集中的恶意数据流量类型包括ftp攻击、ssh攻击和dos攻击等。
3.根据权利要求2所述的一种基于半监督学习的流量识别方法,其特征在于,所述imth2019数据集和cic-ids2017数据集中的数据以pcap文件的形式保存,所述pcap文件中的每一条代表一个数据包;
4.根据权利要求1所述的一种基于半监督学习的流量识别方法,其特征在于,将数据预处理后的数据进行图像转换,生成灰度图像,具体包括:目标图像表示为a*b,像素点用p来表示,关系为:
5.根据权利要求1所述的一种基于半监督学习的流量识别方法,其特征在于,所述构建基于残差网络的流量识别模型,具体包括:将所述模型数据集按照5...
【专利技术属性】
技术研发人员:姜风超,胡福亮,王绪民,刘德志,
申请(专利权)人:江苏君立华域信息安全技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。