一种基于图卷积网络的恶意加密流量检测方法技术

技术编号：35186661 阅读：51 留言：0更新日期：2022-10-12 17:57

一种基于图卷积网络的恶意加密流量检测方法包括：采集已知类别的网络流量数据集；对采集的网络流量数据集进行预处理；构建网络流量交互图；构建包含用图卷积网络和池化层、全连接层和分类器的流量检测模型，将网络流量交互图输入至流量检测模型中进行训练得到最终流量检测模型；将处理后的未知类型网络流量输入至最终流量检测模型进行检测，输出未知类型网络流量所属每个类别的概率，选取最大概率对应的类别作为未知类型网络流量的类型，本方法无需专家手动提取特征，自动从原始流量数据中学习特征并进行恶意加密流量检测，同时，除数据包的有效载荷外，本发明专利技术还对数据包之间的相互关系进行建模，通过丰富多个维度的特征信息，从而提高检测效果。从而提高检测效果。从而提高检测效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于图卷积网络的恶意加密流量检测方法

：
[0001]本专利技术涉及信息安全
，具体涉及一种基于图卷积网络的恶意加密流量检测方法。

技术介绍
：
[0002]随着SSL/TLS加密协议的广泛使用，网络中的加密流量占比逐渐增高，同时恶意攻击者利用加密技术将越来越多的攻击行为隐藏在加密流量中，这对网络加密流量的安全性造成巨大的威胁。恶意加密流量检测的目的在于检测出加密流量中的各类恶意软件活动所产生的恶意流量，从而保护网络流量安全。然而由于流量经过加密，导致传统流量检测方法如基于端口和深度包检测方法失效，使得网络环境安全面临严峻考验。
[0003]目前，基于统计特征的机器学习检测方法其特征工程的实现严重依赖于专家经验，导致该方法的灵活性较差，对于目前网络流量类型更新迭代迅速的场景，该方法难以胜任。授权公开号为CN108833360B的专利提出一种基于机器学习的恶意加密流量识别方法，该专利通过提取32种统计性特征作为流量识别方法，并采用随机森林算法进行训练，训练好的模型拥有着极高的识别率以及极低的误报率和漏报率。公开号为CN112261007A的专利提出一种基于机器学习的https恶意加密流量检测方法，通过手动提取统计量特征、证书特征和域名特征等多个维度的特征构建特征集合，并使用随机森林模型进行检测。
[0004]综上，目前的方法无法解决如下问题：基于机器学习的检测方法依赖于专家经验提取特征，不可避免的带有一定的主观性，从而影响检测结果。

技术实现思路
：
[0005]为解决基于机器学习的...

【技术保护点】

【技术特征摘要】
1.一种基于图卷积网络的恶意加密流量检测方法，其特征在于，所述方法包括：采集已知类别的网络流量数据集，所述已知类别的网络流量数据集包括恶意加密流量数据集和良性加密流量数据集；对采集的网络流量数据集进行预处理，将所述网络流量数据转换为流量矩阵；构建网络流量交互图；构建包含用于特征提取的图卷积网络和池化层、全连接层和分类器的流量检测模型，将网络流量交互图输入至所述流量检测模型中进行训练得到最终流量检测模型；将经过预处理并构建了网络流量交互图的未知类型网络流量输入至最终流量检测模型进行检测，输出未知类型网络流量所属每个类别的概率，选取最大概率对应的类别作为未知类型网络流量的类别；其中，所述对网络流量数据集进行预处理的方法具体包括：对网络流量数据集中所有数据进行流量切分：按网络流量属性中的五元组将原始流量切分为数据包，将源到目标和目标到源的数据包按照时间顺序排列生成双向会话流；并将每个会话流以pcap文件的形式保存为单个文件；其中，所述五元组包括：源IP、源端口、目的IP、目的端口和传输层协议；对会话流进行数据清洗：对于每条会话流，删除无效数据，遍历每条会话流的每个数据包，屏蔽链路层、网络层和传输层中一些与网络类型无关的数据；提取清洗后的流量数据的前N个数据包的前M个字节，将清洗后的流量数据表示为N*M维的矩阵，对于数据包和字节，超出的部分进行截取，不足的部分补0填充，完成网络流量数据集的预处理；将预处理后的网络流量数据集按照比例划分为训练集和验证集；其中，所述构建网络流量交互图的方法为：将一条会话流中的数据包作为网络流量交互图的顶点，数据包之间的相互关系作为邻接关系建立顶点之间的边；其中，将网络流量交互图输入至所述流量检测模型中进行训练得到最终流量检测模型的方法具体包括：经过多层图卷积网络对网络流量交互图进行图卷积操作，提取会话流的全局特征；然后经过一层池化层将网络流量交互图中的所有顶点特征进行汇集，从而得到整...

【专利技术属性】
技术研发人员：张连新，
申请(专利权)人：方盈金泰科技北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人