一种混合采样网络流量样本平衡方法技术

技术编号:44598101 阅读:22 留言:0更新日期:2025-03-14 12:54
本发明专利技术公开了一种混合采样网络流量样本平衡方法,其步骤为首先对CIC IDS‑2017数据集中的网络流量进行数据预处理,将其划分为训练集和测试集;其次训练集采用SMOTE过采样和ENN欠采样处理,并在SMOTE过采样后引入高斯噪声处理,得到混合采样样本;最后对混合采样样本进行CNN训练并将训练结果通过测试集验证,得出分类结果。本发明专利技术在SMOTE处理后加入高斯噪声,增加数据的复杂性,使得生成的样本更能反映真实网络流量中的多样特征,显著降低过拟合的风险。在ENN中保留多数类重要信息的同时,减少不必要的冗余数据,从而避免了信息损失问题,提高了模型对复杂网络流量数据的适应性。实现了平衡网络流量数据的功能。

【技术实现步骤摘要】

本专利技术涉及网络流量分析,尤其涉及一种混合采样网络流量样本平衡方法


技术介绍

1、随着网络技术的飞速发展,网络流量的急剧增加带来了复杂多样的网络攻击行为,网络安全问题日益严峻。为了提升网络系统对各种异常行为的检测能力,网络流量分析成为了一个关键的研究方向。通过分析网络流量的模式与特征,可以帮助识别潜在的安全威胁,并采取相应的防护措施。

2、在此背景下,机器学习技术在网络流量分析中的应用日益广泛,尤其是通过对网络流量样本的分类与异常检测,能够提升网络安全防护的自动化与智能化水平。然而,网络流量数据通常具有严重的不平衡性,即正常流量样本远多于异常流量样本。这种数据不平衡性会显著影响机器学习模型的性能,导致模型在训练过程中对少数攻击类流量的识别能力下降。因此,如何平衡网络流量数据成为了一个亟待解决的问题。

3、入侵检测系统是网络安全防御的关键技术之一,旨在检测并防御网络中的恶意活动。传统的入侵检测系统主要基于误用检测和异常检测。误用检测通过识别已知攻击模式,能够有效应对已知的威胁,但对未知的攻击和新型威胁无能为力。异常检测则通过建立正本文档来自技高网...

【技术保护点】

1.一种混合采样网络流量样本平衡方法,其特征在于:包括如下步骤:

2.如权利要求1所述混合采样网络流量样本平衡方法,其特征在于:所述步骤S2中,对训练集是的攻击流量进行SMOTE过采样,生成新的合成样本;

3.如权利要求1所述混合采样网络流量样本平衡方法,其特征在于:所述步骤S2中,对训练集进行ENN欠采样的方法是:对于每个样本xi,使用下述欧氏距离公式3进行计算:

4.如权利要求3所述混合采样网络流量样本平衡方法,其特征在于:计算在最近邻样本中,类别y出现的次数对于每个样本xi,如果其k个最近邻样本中多数样本的标签与其标签yi不同,则判定为噪声或边界...

【技术特征摘要】

1.一种混合采样网络流量样本平衡方法,其特征在于:包括如下步骤:

2.如权利要求1所述混合采样网络流量样本平衡方法,其特征在于:所述步骤s2中,对训练集是的攻击流量进行smote过采样,生成新的合成样本;

3.如权利要求1所述混合采样网络流量样本平衡方法,其特征在于:所述步骤s2中,对训练集进行enn欠采样的方法是:对于每个样本xi,使用下述欧氏距离公式3进行计算:

4.如权利要求3所述混合采样网络流量样本平衡方法,其特征在于:计算在最近邻样本中,类别y出现的次数对于每个样本xi,如果其k个最...

【专利技术属性】
技术研发人员:王国华闫启帆张蕾逯闯
申请(专利权)人:兰州交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1