基于混合特征的加密流量分类方法技术

技术编号：28737203 阅读：119 留言：0更新日期：2021-06-06 11:57

本发明专利技术公开了一种基于混合特征的加密流量分类方法，包括以下步骤：数据集采集、数据预处理、搭建CNN模型、CNN自动提取特征、提取流级特征、组合特征、SVM输出分类结果。本发明专利技术分别从一维空间中提取出流的具体特征和从二维空间中提取出流的抽象特征，组成了混合特征，提升了特征结构的复杂性，有效的提高了加密流量分类的准确率。分类的准确率。分类的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
基于混合特征的加密流量分类方法

[0001]本专利技术涉及一种网络流量分类方法，尤其涉及一种基于混合特征的加密流量分类方法。

技术介绍

[0002]网络流量的精准识别与分类是网络安全与网络管理的重要前提，有助于提升网络管理与安全监测水平，改善服务质量。近年来，随着网络技术的飞速发展，流量加密技术得到了广泛应用。越来越多的网络应用采用加密协议保证信息在网络中传输的安全性，也一定程度上保证了私人信息的机密性与完整性。2015年，有21％的网站流量被加密，截至2019年，有超过80％的网站流量被加密，同比增长了90％以上。但网络攻击也以加密流量的隐蔽性为载体，威胁网络安全。2018年思科公司对超过40万的恶意软件进行了分析，发现其中有超过70％的恶意软件在通信时使用了加密。现有以僵尸网络、高级持续性威胁(APT)、木马等为主要形式的网络攻击往往采用了相关隐匿技术绕过安全设备入侵系统。因此对加密流量的识别已经成为防御网络攻击的重点。
[0003]流量分类模型已被广泛应用于从大规模网络流量中自动识别异常流量。这些模型可以分为四类：基于端口的分类方法，深度包检查(DPI)，统计分类方法和行为分类方法。基于端口的方法对于具有特定端口号的应用程序(例如，具有端口21的FTP流量)的分类性能很好，但是由于随机端口和端口伪装技术的普遍使用，基于端口的方法对加密流量分类的精确率低，已不再适用于加密流量的分类。DPI分析整个数据包数据，然后识别其网络协议和应用程序。因为流量负载数据通常用协议加密或封装，包含较少的恒定特征，使得DPI...

【技术保护点】

【技术特征摘要】
1.一种基于混合特征的加密流量分类方法，其特征在于，包括以下步骤：(1)从网络数据流中进行数据采集；(2)对采集的数据进行预处理；(3)搭建卷积神经网络模型；(4)将预处理后的数据输入卷积神经网络模型，提取出一维高层抽象特征向量V1；(5)将预处理后的数据提取出一维流级特征向量V2；(6)将一维高层抽象特征向量V1和一维流级特征向量V2进行组合，生成混合特征向量；(7)将混合特征向量导入SVM中进行训练，并输出分类结果。2.根据权利要求1所述的基于混合特征的加密流量分类方法，其特征在于，步骤(1)中，所述数据采集是使用Wireshark进行流量的捕获并生成原始PCAP文件，再按照五元组对捕获的流量包进行分流，形成原始实验数据集。3.根据权利要求1所述的基于混合特征的加密流量分类方法，其特征在于，步骤(2)中，所述预处理是保留含有有效负载的数据流，并对少于m个字节的数据流进行补零，对超过的m个字节的数据流进行截断，将处理好的数据流进行归一化并生成k*k的包字节矩阵，最终制作成灰度图像集。4.根据权利要求1所述的基于混合特征的加密流量分类方法，其特征在于，步骤(3)中，所述搭建卷积神经网络模型是基于三个卷积层，两个最大池化层与全连接层搭建模型，其中结构为卷积C1

【专利技术属性】
技术研发人员：翟江涛，许历隆，崔永富，林鹏，陈伟，王勤凡，
申请(专利权)人：南京信息工程大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人