僵尸网络流量检测方法、设备及存储介质技术

技术编号:39316081 阅读:6 留言:0更新日期:2023-11-12 15:59
本发明专利技术公开了一种僵尸网络流量检测方法、设备及存储介质,该方法包括获取流量数据集,对流量数据集中的pcap文件进行预处理,得到输入向量;由输入向量及与该输入向量对应的类别构成样本数据集;构建并训练一维卷积神经网络模型,得到初始僵尸网络流量检测模型;确定待检测场景,获取待检测场景中的网络流量数据;对网络流量数据进行预处理,得到场景输入向量;标注每个场景输入向量的属性标签,由场景输入向量及与该场景输入向量对应的属性标签构成场景样本数据集;对初始僵尸网络流量检测模型进行迁移学习训练,得到目标僵尸网络流量检测模型。本发明专利技术实现了在无先验知识的条件下对传统僵尸网络流量通用的检测。对传统僵尸网络流量通用的检测。对传统僵尸网络流量通用的检测。

【技术实现步骤摘要】
僵尸网络流量检测方法、设备及存储介质


[0001]本专利技术属于网络安全
,尤其涉及一种基于一维卷积神经网络的僵尸网络流量检测方法、设备及存储介质。

技术介绍

[0002]随着近年来互联网的快速发展,人们使用的网络设备和家庭中物联网设备的数据急剧上升,这在给人们生活带来便利的同时也带来许多安全问题,其中较为典型的有僵尸网络。近年来僵尸网络安全事件频发,威胁程度日益增加,对于僵尸网络流量的检测和识别工作,僵尸网络跨场景检测存在性能下降的问题。
[0003]僵尸网络Botnet是指采用一种或多种传播手段,将大量主机感染bot程序(僵尸程序)病毒,从而在控制者和被感染主机之间所形成的一个可一对多控制的网络。僵尸网络通过命令和控制(command and control,C&C)服务器来远程控制地理上不同的主机或者设备的集群。僵尸网络通常被用于各种恶意活动,如发送垃圾邮件、发起分布式拒绝服务(distributed denial of service attack,DDoS)攻击、广告欺诈和身份盗窃等。僵尸网络通过发起零日攻击、电子邮件附件等各种手段对互联网上脆弱的、易受攻击的设备进行破解。一旦这些设备被破解,僵尸网络将为其安装一个后门,并且连接到C&C服务器,使这些设备成为僵尸网络的一部分;然后,C&C服务器通过向僵尸主机发送指令,从而发起各种恶意活动。与其他恶意软件相比,攻击者利用不知情和无辜用户的计算机或者设备来进行恶意活动,不仅能获得巨大的收益,同时其被检测的概率也更低。
[0004]目前,多采用基于会话的方式来检测流量,尽管最终僵尸网络检测的准确率较高,但其在预处理过程中,筛除的流量中包含了僵尸网络的扫描流量以及DDoS攻击流量等有价值的信息。此外,对频繁变换IP以及端口的僵尸网络流量进行会话重组也是一件极其耗时耗力的事情,这导致了基于会话的方法在数据集庞大的情况下对僵尸网络的检测难以达到检测的实时性。部分有监督工作没有考虑到僵尸网络检测的迁移性表现,僵尸网络不仅家族庞大,且不同环境下的僵尸网络流量会存在一定的差异,例如物联网设备僵尸网络流量和传统僵尸网络流量之间的差别往往会比较大,用某一场景下僵尸网络流量训练好的模型再去测试其他场景的僵尸网络流量会使得原模型性能下降。

技术实现思路

[0005]本专利技术的目的在于提供一种僵尸网络流量检测方法、设备及存储介质,实现在无需僵尸网络协议、家族等先验知识的条件下对传统僵尸网络流量和物联网设备僵尸网络流量通用的检测,并且使用迁移学习来提升模型对僵尸网络跨场景检测的性能。
[0006]本专利技术是通过如下的技术方案来解决上述技术问题的:一种僵尸网络流量检测方法,包括以下步骤:
[0007]获取流量数据集,其中所述流量数据集包括僵尸网络流量数据和正常流量数据;
[0008]对所述流量数据集中的pcap文件进行预处理,得到符合一维卷积神经网络模型输
入格式的输入向量;
[0009]由所述输入向量及与该输入向量对应的类别构成一个样本,由多个样本构成样本数据集;
[0010]构建一维卷积神经网络模型,利用所述样本数据集对所述一维卷积神经网络模型进行训练,得到初始僵尸网络流量检测模型;
[0011]确定待检测场景,获取待检测场景中的网络流量数据;
[0012]对所述网络流量数据进行预处理,得到符合一维卷积神经网络模型输入格式的场景输入向量;
[0013]标注每个场景输入向量的属性标签,由所述场景输入向量及与该场景输入向量对应的属性标签构成一个场景样本,由多个场景样本构成场景样本数据集;
[0014]利用所述场景样本数据集对所述初始僵尸网络流量检测模型进行迁移学习训练,得到目标僵尸网络流量检测模型。
[0015]进一步地,对所述流量数据集中的pcap文件进行预处理,得到符合一维卷积神经网络模型输入格式的输入向量,具体实现过程包括:
[0016]采用数据包窗口对每个pcap文件进行分割,得到多个pcap小文件,其中每个pcap小文件均包括N个数据包,N为数据包窗口大小;
[0017]提取每个pcap小文件中每个数据包的前M个字节,由N个数据包的前M个字节生成对应pcap小文件的输入向量。
[0018]进一步地,当所述数据包的字节数小于M时,采用零进行填充。
[0019]进一步地,所述一维卷积神经网络包括依次连接的输入层、第一卷积层、第二卷积层、最大池化层、第一全连接层、第二全连接层、第三全连接层、Softmax分类层以及输出层。
[0020]进一步地,所述一维卷积神经网络模型具体训练过程包括:
[0021]将所述输入向量输入至一维卷积神经网络模型中,得到输出向量;
[0022]根据所述输出向量和与该输入向量对应的类别计算出损失函数;
[0023]当损失值大于设定值时,通过优化器对一维卷积神经网络模型中的参数进行调整;
[0024]当损失值小于等于设定值且达到迭代次数时,得到初始僵尸网络流量检测模型。
[0025]进一步地,所述优化器为Adam优化器。
[0026]进一步地,在迁移学习训练过程中,所述初始僵尸网络流量检测模型前四层的参数保持不变,仅对全连接层的参数进行调整。
[0027]基于同一构思,本专利技术还提供了一种电子设备,所述设备包括:
[0028]存储器,用于存储计算机程序;
[0029]处理器,用于执行所述计算机程序时实现如上所述的僵尸网络流量检测方法。
[0030]基于同一构思,本专利技术还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的僵尸网络流量检测方法。
[0031]有益效果
[0032]与现有技术相比,本专利技术的优点在于:
[0033]本专利技术提供的一种僵尸网络流量检测方法,采用数据包窗口对流量数据进行切
割,并结合深度学习法对切割后的流量样本进行特征的自动化提取和分类,实现了在无需僵尸网络协议、家族等先验知识的条件下对传统僵尸网络流量和物联网设备僵尸网络流量通用的检测;本专利技术还利用检测场景的少量样本对模型进行迁移学习训练,显著提高了模型对僵尸网络跨场景检测的性能;本专利技术方法不仅在传统僵尸网络的检测上有着较高的准确率,而且在跨场景检测的情况下有着良好的表现,实用性强。
附图说明
[0034]为了更清楚地说明本专利技术的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一个实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0035]图1是本专利技术实施例中僵尸网络流量检测方法流程图;
[0036]图2是本专利技术实施例中一维卷积神经网络模型架构图;
[0037]图3是本专利技术实施例中不同物联网设备僵尸网络家族流本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种僵尸网络流量检测方法,其特征在于,包括以下步骤:获取流量数据集,其中所述流量数据集包括僵尸网络流量数据和正常流量数据;对所述流量数据集中的pcap文件进行预处理,得到符合一维卷积神经网络模型输入格式的输入向量;由所述输入向量及与该输入向量对应的类别构成一个样本,由多个样本构成样本数据集;构建一维卷积神经网络模型,利用所述样本数据集对所述一维卷积神经网络模型进行训练,得到初始僵尸网络流量检测模型;确定待检测场景,获取待检测场景中的网络流量数据;对所述网络流量数据进行预处理,得到符合一维卷积神经网络模型输入格式的场景输入向量;标注每个场景输入向量的属性标签,由所述场景输入向量及与该场景输入向量对应的属性标签构成一个场景样本,由多个场景样本构成场景样本数据集;利用所述场景样本数据集对所述初始僵尸网络流量检测模型进行迁移学习训练,得到目标僵尸网络流量检测模型。2.根据权利要求1所述的僵尸网络流量检测方法,其特征在于,对所述流量数据集中的pcap文件进行预处理,得到符合一维卷积神经网络模型输入格式的输入向量,具体实现过程包括:采用数据包窗口对每个pcap文件进行分割,得到多个pcap小文件,其中每个pcap小文件均包括N个数据包,N为数据包窗口大小;提取每个pcap小文件中每个数据包的前M个字节,由N个数据包的前M个字节生成对应pcap小文件的输入向量。3.根据权利要求2所述的僵尸网络流量检测方法,其...

【专利技术属性】
技术研发人员:张士庚肖凯
申请(专利权)人:郑州信大先进技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1