一种基于向量化的恶意流量攻击类型的判断方法技术

技术编号：24252315 阅读：60 留言：0更新日期：2020-05-22 23:58

本发明专利技术提供一种基于向量化的恶意流量攻击类型的判断方法，涉及信息处理技术领域。该方法首先把原始流量数据以会话为单位进行长度统一，然后送入自动编码机模型提取大小一致长度适中的会话数据，将处理后的会话数据转化为图像集合，送入卷积神经网络训练得到向量，并与对应统计特征提取的向量进行拼接，得到新的流量向量集合，并放到临时数据库中；对临时数据库中的向量以余弦距离为依据进行聚类，找出聚类中心的向量，构建行为向量库；预处理后的待检测流量向量与行为向量库中向量以余弦距离为依据进行相似度检测，获得待检测流量的流量类型。本发明专利技术方法通过向量距离的计算，提高了检测的效率，有效的降低了相似的恶意流量特征的误判程度。

A judgment method of malicious traffic attack type based on Vectorization

全部详细技术资料下载

【技术实现步骤摘要】
一种基于向量化的恶意流量攻击类型的判断方法
本专利技术涉及信息处理
，尤其涉及一种基于向量化的恶意流量攻击类型的判断方法。
技术介绍
随着互联网的快速发展，通信网络发展迅猛，网络攻击层出不穷。为保证和提高网络的可用性和可靠性，如何有效预防和检测恶意流量成为业界和学术界共同关注的重点问题。大量文献表明，网络流量在正常运行的情况下是具有一定的周期性和稳定性的，不同时段的不同协议的流量均匀增加或者减少是正常状态，比如节假日时段的不同网络协议的流量比工作时的成相同比例的减少，当流量偏离了其正常的行为，打破这一规律，发生比较明显的突变时，就可能发生了异常。传统检测流量异常的方法分为基于端口和基于深度包检测，这一过程都是依赖于人为制定的规则。人为制定的规则又依赖于人工统计的数据，人工统计这一过程需要大量的人力物力，且效率也不高，制定出来的规则也是固定不变的，不具备可扩展性，这就要求规则制定者考虑全面，提前设定所有可能的异常检测情况，这往往是不现实的。另一方面，传统检测流量异常的方法往往只是检测到了网络流量中的一种或者几种特征向量，而且选取的特征向量没有特定的攻击类型定义，因而检测系统检测时只知道网络中某些特征向量出现了异常，但是不能判断出现了什么样的攻击。随着机器学习技术的迅猛发展以及人工智能产业的迅速崛起，使用机器学习、深度学习方法进行流量异常检测成为业界和学术界关注的重点，相关研究工作已经存在很多，研究成果在一定程度上也推动着流量异常检测工作高效进展。但机器学习技术以及深度学习方法在应用过程中也...

【技术保护点】
1.一种基于向量化的恶意流量攻击类型的判断方法，其特征在于：包括以下步骤：/n步骤1、对原始流量数据以会话为单位进行划分，根据已知的流量类型，对划分后的每一条流量数据标记流量类型；所述原始流量数据包括原始的正常流量数据以及原始的异常流量数据；/n步骤2、构建一个5层的深度自动编码机模型和一个卷积神经网络模型；/n步骤3、对步骤1中的已标记流量类型的流量数据进行再处理，在保留原数据关键信息的基础上统一数据长度；/n步骤4、将经过步骤3处理后的数据输入到步骤2构建的自动编码机模型中，进行特征提取，突出流量数据中的关键特征，得到大小一致，分布相对均匀的数据集合；/n步骤5、将步骤4中得到的数据集合中的每一个流量数据转化为十六进制表示形式，然后再将流量数据转换成二维数组，最后将二维数组转化为一张灰度图，得到一个图像集合；/n步骤6、将步骤5得到的图像集合输入到步骤2构建的卷积神经网络结构中，利用卷积神经网络结构进行特征的再提取，输出流量数据向量；/n步骤7、对原始流量数据进行统计特征提取，再将统计特征向量化，并与步骤6中得到的流量数据向量对应拼接，得到新的流量向量集合，并将新获得的流量向量放入...

【技术特征摘要】
1.一种基于向量化的恶意流量攻击类型的判断方法，其特征在于：包括以下步骤：
步骤1、对原始流量数据以会话为单位进行划分，根据已知的流量类型，对划分后的每一条流量数据标记流量类型；所述原始流量数据包括原始的正常流量数据以及原始的异常流量数据；
步骤2、构建一个5层的深度自动编码机模型和一个卷积神经网络模型；
步骤3、对步骤1中的已标记流量类型的流量数据进行再处理，在保留原数据关键信息的基础上统一数据长度；
步骤4、将经过步骤3处理后的数据输入到步骤2构建的自动编码机模型中，进行特征提取，突出流量数据中的关键特征，得到大小一致，分布相对均匀的数据集合；
步骤5、将步骤4中得到的数据集合中的每一个流量数据转化为十六进制表示形式，然后再将流量数据转换成二维数组，最后将二维数组转化为一张灰度图，得到一个图像集合；
步骤6、将步骤5得到的图像集合输入到步骤2构建的卷积神经网络结构中，利用卷积神经网络结构进行特征的再提取，输出流量数据向量；
步骤7、对原始流量数据进行统计特征提取，再将统计特征向量化，并与步骤6中得到的流量数据向量对应拼接，得到新的流量向量集合，并将新获得的流量向量放入临时数据库中；所述临时数据库存储临时的向量数据，在进行聚类操作后，临时数据库会清空；
步骤8、根据步骤1中标注的流量类型，对临时数据库中的流量向量进行分类，针对每一类别的流量向量集合根据余弦距离进行聚类，得到聚类中心点向量，以该聚类中心向量代表这一类别的流量类型，保存到行为向量库中；
步骤9、对于待检测的恶意流量，按照步骤1-步骤7获得其特...

【专利技术属性】
技术研发人员：赵玉媛，吴振豪，陈钟，李青山，杨可静，兰云飞，吴琛，李洪生，王晓青，
申请(专利权)人：博雅信安科技北京有限公司，北京国信云服科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人