The embodiment of the invention provides a detection method and system for abnormal traffic data. The method includes: input the characteristics of any traffic data in the data packet to be detected into the trained automatic encoder model or principal component analysis model to get the corresponding score of any traffic data; if the score is greater than the preset abnormal threshold, then determine any traffic data as abnormal traffic data. The method and system provided by the embodiment of the present invention can detect abnormal traffic data online or offline by using principal component analysis method in unsupervised machine learning clustering algorithm and automatic encoder, and has a wider application. Moreover, the use of machine learning algorithm to detect abnormal traffic data in the network can avoid the high filtering error caused by human factors in the process of screening, so that the network can take appropriate actions in advance to reduce the probability of network attacks and user privacy leaks.
【技术实现步骤摘要】
一种异常流量数据的检测方法及系统
本专利技术实施例涉及网络安全
,尤其涉及一种异常流量数据的检测方法及系统。
技术介绍
当今网络技术发展迅猛,网络每天都会产生数亿兆级别的流量,网络流量检测关系着网络安全和用户隐私安全等多方面问题,因而越来越受到人们的关注。网络异常流量检测是网络安全领域中一个非常重要且热门的研究方向。网络异常流量检测是指从大量混合的网络流量数据中把具有网络攻击行为的异常流量分离出来以区别于正常行为的流量数据。网络安全中的异常流量检测要求检测系统能够快速准确地检测出网络中的异常流量,同时保证能够对在线流量实时检测尤为重要。针对目前现有的异常流量检测方法,其很难进行在线检测,同时当网络发生新的攻击行为时,现有的异常流量检测方法很难将其检测出来。
技术实现思路
本专利技术实施例提供一种异常流量数据的检测方法及系统,用以解决现有技术中无法快速准确地检测出网络中的异常流量数据且无法对在线流量数据进行实时检测的缺陷,提高了异常流量数据检测的效率和准确率,并能够对在线流量数据进行实时检测。本专利技术实施例提供一种异常流量数据的检测方法,包括:将待检测流量数据包中的任一条流量数据的特征输入至训练好的自动编码器模型或主成分分析模型中,以获取所述任一条流量数据对应的评分;若所述评分大于预设异常门限,则判定所述任一条流量数据为异常流量数据。本专利技术实施例提供一种异常流量数据的检测系统,包括:特征输入模块,用于将待检测流量数据包中的任一条流量数据的特征输入至训练好的自动编码器模型或主成分分析模型中,以获取所述任一条流量数据对应的评分;异常流量数据判定模块,用于 ...
【技术保护点】
1.一种异常流量数据的检测方法,其特征在于,包括:将待检测流量数据包中的任一条流量数据的特征输入至训练好的自动编码器模型或主成分分析模型中,以获取所述任一条流量数据对应的评分;若所述评分大于预设异常门限,则判定所述任一条流量数据为异常流量数据。
【技术特征摘要】
1.一种异常流量数据的检测方法,其特征在于,包括:将待检测流量数据包中的任一条流量数据的特征输入至训练好的自动编码器模型或主成分分析模型中,以获取所述任一条流量数据对应的评分;若所述评分大于预设异常门限,则判定所述任一条流量数据为异常流量数据。2.根据权利要求1所述的方法,其特征在于,所述将待检测流量数据包中的任一条流量数据的特征输入至训练好的自动编码器模型或主成分分析模型中,以获取所述任一条流量数据对应的评分,之前还包括:获取所述任一条流量数据的原始特征,其中,所述原始特征包括统计特征和/或字符特征;将所述原始特征进行标准化,以获取所述任一条流量数据的特征;其中,标准化的公式如下:其中,为待检测流量数据包中第k条流量数据的第i个特征,为待检测流量数据包中第k条流量数据的第i个原始特征。3.根据权利要求2所述的方法,其特征在于,所述获取所述任一条流量数据的原始特征,进一步包括:获取所述任一条流量数据的http请求字段;在所述http请求字段中,获取所述任一条流量数据的请求响应码、响应尺寸、请求参数、请求字符频率熵、请求字符频率和请求路径中的一种或任意多种,并作为所述任一条流量数据的统计特征;基于n-gram算法,获取所述任一条流量数据的字符特征;将所述统计特征和/或所述字符特征作为所述任一条流量数据的原始特征。4.根据权利要求1所述的方法,其特征在于,所述训练好的自动编码器模型的训练步骤如下:构建所述自动编码器模型的第一目标函数;在训练集上对所述第一目标函数进行训练,以使所述第一目标函数最小;其中,构建所述第一目标函数L的公式如下:其中,xi为将第i条流量数据的所有特征,xi'为将第i条流量数据的所有特征输入至自动编码器模型得到的输出向量,h为稀疏参数,hj为隐藏层中第j个神经元的活跃度。5.根据权利要求1所述的方法,其特...
【专利技术属性】
技术研发人员:王小娟,张勇,金磊,陈旭,由靖文,陈墨,宋梅,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。