一种基于近邻样本万有引力的网络入侵检测方法技术

技术编号：22330769 阅读：45 留言：0更新日期：2019-10-19 12:24

本发明专利技术公开了一种面向不平衡网络入侵检测的基于熵和万有引力的动态半径近邻分类器，包括通过利用信息熵和样本不平衡率，定义不同分布的样本具有不同的质量；通过利用一范数距离动态的计算每一个测试样本的近邻候选集半径，得到测试样本的近邻候选集；通过计算测试样本的候选集中正、负类样本对测试样本的万有引力，将测试样本分为万有引力较大的那一类。本发明专利技术弥补了现有的近邻分类器忽视不平衡问题本身的特性的缺陷，能很好地用于不平衡数据分类，且分类器算法复杂度较低。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于近邻样本万有引力的网络入侵检测方法
本专利技术涉及一种基于近邻样本万有引力的网络入侵检测方法，属于数据分类

技术介绍
随着基于计算机网络的服务和网络敏感信息的迅猛发展，网络安全问题越来越受到人们的重视。计算机网络安全在现代计算机系统中起着重要的战略作用，而网络入侵检测系统已成为网络安全基础设施的重要组成部分。网络入侵检测是指用于隔离针对计算机和网络的攻击的一组技术，即网络入侵检测系统用于检测网络中的敌对活动。除了检测攻击之外，这样的系统还必须防止其恶意影响，或协助人类在系统或网络管理员中扮演预防角色。随着互联网的进一步发展，尽管已有很多复杂且高效的网络入侵检测系统，但由于网络入侵攻击利用了系统和应用软件中始终包含的未知弱点或漏洞，网络安全是很难保证的。目前现有的网络攻击检测方法可分为三类：1)基于规则的检测方法，该方法高度依赖现有规则数据库，无法及时更新以应对新的网络攻击手段，因此很容易造成较大的损失；2)基于网络流特征分布的检测方法，由于这种检测方式具有很强的随机性，使得一部分网络入侵手段能够巧妙避开；3)基于机器学习的入侵检测方法，该方法利用机器学习中的一些算法对网络数据进行预测，从而有效地及时应对一些网络攻击。常用机器学习算法如支持向量机，随机森林，神经网络等。基于机器学习网络入侵检测方法能够较有效应对未知的网络攻击，然而，从高度不平衡的网络入侵数据集中学习出高效的模型是一个不可忽视的内在问题，传统的机器学习方法难以高效地解决不平衡的网络入侵问题。在不平衡数据中，更受人们关注的一类问题的样本数量往往少于其他类，且由于少数类的特殊性和...

【技术保护点】
1.一种基于近邻样本万有引力的网络入侵检测方法，其特征在于，所述网络入侵检测方法包括以下步骤：1)预处理第一步：通过网络数据采集工具构建网络攻击特征，将采集的样本集特征转为适于后续处理的数据矩阵，并对所有离散特征进行one‑hot的转换；2)训练第一步：对一个包括正、负类样本的不平衡网络入侵数据的训练样本集进行学习，得到每个训练样本的质量；3)测试第一步：通过利用一范数距离动态的计算测试样本到所有训练样本的距离，得到测试样本的近邻候选集半径R；所述一范数距离为：

【技术特征摘要】
1.一种基于近邻样本万有引力的网络入侵检测方法，其特征在于，所述网络入侵检测方法包括以下步骤：1)预处理第一步：通过网络数据采集工具构建网络攻击特征，将采集的样本集特征转为适于后续处理的数据矩阵，并对所有离散特征进行one-hot的转换；2)训练第一步：对一个包括正、负类样本的不平衡网络入侵数据的训练样本集进行学习，得到每个训练样本的质量；3)测试第一步：通过利用一范数距离动态的计算测试样本到所有训练样本的距离，得到测试样本的近邻候选集半径R；所述一范数距离为：y,x为两个样本，d(·)表示样本y和x之间的距离，m是样本y和x的特征维度，yi和xi分别是样本y和x在第i个特征维度上的值。4)测试第二步：通过前述测试样本的近邻候选集半径R选择到测试样本的距离小于所述近邻候选集半径R的样本，得到测试样本的近邻候选集；Candi|Candi∈Xtrain,d(Candi,y)＜R5)测试第三步：通过计算测试样本的近邻候选集中正、负类样本对测试样本的万有引力，将测试样本分为万有引力较大的那一类。2.根据权利要求1所述的方法，其特征在于，所述每个训练样本的质量的计算过程包括几下步骤：通过训练样本中正、负类样本的比值，得到样本不平衡率IR，其中IR为所述正负类样本的不平衡率，表示正、负类样本与正类样本的比值。nneg为负类样本的个数，n...

【专利技术属性】
技术研发人员：王喆，迟子秋，李艳琼，李冬冬，杜文莉，杨海，
申请(专利权)人：华东理工大学，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人