一种具有计算资源自适应性的异常流量检测方法技术

技术编号：20875531 阅读：44 留言：0更新日期：2019-04-17 11:23

本发明专利技术提供一种具有计算资源自适应性的异常流量检测方法，属于计算机网络和机器学习的交叉领域。该方法包括模型训练和在线识别两部分，目的在于可以根据当前CPU资源情况，动态调节模型的参数，在满足准确率的情况下，提高识别的速度，同时可以降低内存占用率。本发明专利技术构建了一个动态获取参数方法，由此实现根据当前CPU占用率的情况，通过建立好的模型得到相应的参数，再利用该参数用深度学习模型对流量进行检测。

全部详细技术资料下载

【技术实现步骤摘要】
一种具有计算资源自适应性的异常流量检测方法
本专利技术属于计算机网络和机器学习的交叉领域，涉及一种具有计算资源自适应性的异常流量检测方法。
技术介绍
近年来，随着互联网的不断发展，网络流量的规模呈现爆炸式的增长，同时网络应用的多样化使得网络安全问题变得复杂多样。一些恶意攻击产生的异常流量影响了网络服务的正常运行，严重者甚至可以造成大规模的网络瘫痪。网络异常流量检测一般是通过对网络流量数据进行检测和分析，尽早识别出网络中是否存在攻击和破坏行为，为网络安全管理提供决策依据。因此，网络异常流量检测已成为网络安全研究的重点。传统的流量检测方法包括基于端口的预测方法和基于有效载荷的深度检测方法。基于端口的方法很简单，因为许多众所周知的应用程序都有特定的端口号。然而并不是所有当前的应用程序都使用标准端口号，有些应用程序甚至使用其他应用程序的端口来伪装自己，避免了被该方法检测到。另一种方法是检查每个数据包的有效载荷。当有效载荷未加密时，这种技术可以是非常准确的。但是有些P2P的应用如BitTorrent使用纯文本密码、可变长度的包和一些加密手段来进行信息保护，从而无法实现检测与识别。为了避免传统方法存在的问题，人们越来越多开始研究使用机器学习的方法来实现流量检测。该类方法通常是基于训练数据集建立一个用于流量分类的模型，从而利用模型对流量进行分类来达到检测的目的。目前大多数的研究都是针对模型及算法进行改进来追求检测的准确率，而往往忽视了算法在实际应用中所要面临的计算资源有限性等问题。例如，在当前基于深度学习的流量检测模型中，所输入的数据长度往往是固定的。一些工作是截取网络...

【技术保护点】
1.一种具有计算资源自适应性的异常流量检测方法，其特征在于，包括模型训练和在线识别；步骤一、模型训练首先，将给定数据集分成训练数据集与测试数据集；然后，利用训练数据集建立用于分类的网络模型1D‑CNN，利用测试数据集测试1D‑CNN，测试过程中不断修正参数，得到三类实验数据：识别时间、识别准确率和当前CPU占用率的情况；最后，将三类实验数据分别送到最小二乘法算法中得到三个回归模型：(1)识别时间与CPU空闲率：t＝f1(x)；(2)截取长度与识别时间：l＝f2(x)；(3)识别准确率与截取长度：p＝f3(x)；步骤二、在线识别(2.1)CPU占用率监控：监控并获取当前机器运转情况下CPU占用率的情况；(2.2)获取参数：(A)获取识别时间t设监控到当前CPU占用率为a，则空闲率为1‑a，将当前CPU空闲率输入线性回归函数t＝f1(x)，得到获取识别时间t；(B)获取截取长度l将当前CPU占用率情况下允许的最短识别时间tmin输入线性回归函数l＝f2(x)，得到应截取的长度l；(C)获取识别准确率p将应截取的长度l输入非线性回归函数p＝f3(x)，得到识别准确率p；(D)判断准确率设当前...

【技术特征摘要】
1.一种具有计算资源自适应性的异常流量检测方法，其特征在于，包括模型训练和在线识别；步骤一、模型训练首先，将给定数据集分成训练数据集与测试数据集；然后，利用训练数据集建立用于分类的网络模型1D-CNN，利用测试数据集测试1D-CNN，测试过程中不断修正参数，得到三类实验数据：识别时间、识别准确率和当前CPU占用率的情况；最后，将三类实验数据分别送到最小二乘法算法中得到三个回归模型：(1)识别时间与CPU空闲率：t＝f1(x)；(2)截取长度与识别时间：l＝f2(x)；(3)识别准确率与截取长度：p＝f3(x)；步骤二、在线识别(2.1)CPU占用率监控：监控并获取当前机器运转情况下CPU占用率的情况；(2.2)获取参数：(A)获取识别时间t设监控到当前CPU占用率为a，则空闲率为1-a，将当前CPU空闲率输入线性回归函数t＝f1(x)，得到获取识别时间t；(B)获取截取长度l将当前CPU占用率情况下允许的最短识别时间tmin输入线性回归函数l＝f2(x)，得到应截取的长度l；(C)获取识别准确率p将应截取的长度l输入非线性回归函数p＝f3(x)，得到识别准确率p；(D)判断准确率设当前保证准确率达到p’，则将步骤(C)获得的p与p’进行比较，当满足准确率要求时，则直接输出截取长度l，否则将l递增，循环执行步骤(C)中，直到满足准确率p’，再输出截取长度l；(2.3)网络流量数据的采集：对计算机网络数据流的特性和变化情况进行监测和分析，掌握整个网络的流量特性；(2.4)网络流量数据的预处理(E)通过editcap命令将应用的首个数据包分离提取出来；(F)将数据包的内容转换成用十进制表示；(G)截取前N个字节，即步骤(D)获取的截取长度l；(2.5)1D-CNN流量的识别(H)数据预处理：根据当前计算机的CPU占用率，计算出当前CPU的空闲率，再通过函数t＝f...

【专利技术属性】
技术研发人员：张琬茜，齐恒，李克秋，王军晓，
申请(专利权)人：大连理工大学，
类型：发明
国别省市：辽宁,21

全部详细技术资料下载我是这个专利的主人