一种基于自动编码器的网络流量异常行为识别方法技术

技术编号：25314991 阅读：223 留言：0更新日期：2020-08-18 22:32

本发明专利技术提供一种基于自动编码器的网络流量异常行为识别方法，属于机器学习与信息安全结合的交叉技术领域，使用综合少数过采样方法来平衡流量数据中正常流量数据和异常流量数据的类别分布，并结合自动编码器，从而能够有效地从海量数据中提取非线性结构信息，识别出网络流量中的异常行为。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于自动编码器的网络流量异常行为识别方法
本专利技术提出了一种有效的网络流量异常行为识别方法。该方法结合了综合少数过采样方法和自动编码器分类算法，属于机器学习与信息安全结合的交叉

技术介绍
随着信息化时代的飞速发展，互联网已经成为人们生活中不可缺少的一部分。然而，网络中的攻击行为的频率和攻击事件规模也不断增加，这些攻击行为不仅会造成巨大的经济损失，对社会稳定和国家安全也造成了严重的威胁，维护网络空间的安全已成为亟待解决的问题。为了更好的维护网络空间安全，保证各项网络资源的可用性，防止各种攻击行为的发生，作为主动防御方法的入侵检测技术成为当前研究的热点问题。入侵检测系统是一种积极主动的安全防护技术，可以监控网络中数据的传输行为，发现可疑传输后发出警报或中断异常传输行为。入侵检测的概念最早是由JamesAnderson在1980年提出的，用于监控攻击行为。目前已经有大量的研究对网络入侵行为进行检测，这些工作可以分为基于误用的入侵检测系统(MIDS)和基于异常的入侵检测系统(AIDS)。MIDS又称基于签名的入侵检测系统，根据已有的知识来检测攻击行为。虽然MIDS具有较高的准确率和较低的误报率，但它无法检测不在签名数据库的未知攻击。不同于MIDS，AIDS可以通过比较正常行为和异常行为来检测未知的攻击。因此，AIDS正引起越来越多的关注，其中最重要的一种方法就是使用基于特征的传统机器学习方法，例如决策树、随机森林、朴素贝叶斯方法等。然而，基于传统机器学习方法的入侵检测通常强调特征工程，是较为浅层的学习...

【技术保护点】
1.一种基于自动编码器的网络流量异常行为识别方法，包括以下步骤：/n1)使用自动编码器来构建稀疏异常入侵检测模型SAIDS；/n2)对SAIDS模型进行训练，步骤包括：/nSAIDS模型对原始训练数据进行预处理，对预处理后的训练数据采用综合少数过采样方法来平衡流量数据中正常流量和异常流量的类别分布，得到平衡数据；/n根据平衡数据来进行正常流量和异常流量的分类，计算损失值，找出最小损失值对应的模型参数，得到训练好的SAIDS模型；/n3)利用训练好的SAIDS模型检测待识别的网络流量，步骤包括：/nSAIDS模型对待识别的网络流量进行预处理，对预处理后的网络流量进行正常流量和异常流量的分类，识别出异常行为。/n

【技术特征摘要】
1.一种基于自动编码器的网络流量异常行为识别方法，包括以下步骤：
1)使用自动编码器来构建稀疏异常入侵检测模型SAIDS；
2)对SAIDS模型进行训练，步骤包括：
SAIDS模型对原始训练数据进行预处理，对预处理后的训练数据采用综合少数过采样方法来平衡流量数据中正常流量和异常流量的类别分布，得到平衡数据；
根据平衡数据来进行正常流量和异常流量的分类，计算损失值，找出最小损失值对应的模型参数，得到训练好的SAIDS模型；
3)利用训练好的SAIDS模型检测待识别的网络流量，步骤包括：
SAIDS模型对待识别的网络流量进行预处理，对预处理后的网络流量进行正常流量和异常流量的分类，识别出异常行为。

2.如权利要求1所述的方法，其特征在于，原始训练数据包括NSL-KDD数据集和UNSW-NB15数据集。

3.如权利要求1所述的方法，其特征在于，原始训练数据带有正常流量和异常流量的类别标签。

4.如权利要求1所述的方法，其特征在于，通过预处理得到标准化数据，预处理包括将符号数据使用one-hot编码转换为数值型数据，并对数值型数据进行归一化...

【专利技术属性】
技术研发人员：蹇诗婕，姜波，卢志刚，刘玉岭，杜丹，刘宝旭，
申请(专利权)人：中国科学院信息工程研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人