网络连接数据分类方法技术

技术编号:17784066 阅读:51 留言:0更新日期:2018-04-22 15:24
本发明专利技术提供了一种提高网络连接数据的分类准确率的网络连接数据分类装置。本发明专利技术提供的网络连接数据分类装置,用于对W个不同的网络连接数据进行分类,包括:设定M个分类;根据d个特征属性值设定一个d维求解空间;在d维求解空间中随机生成N个粒子;分别计算每个网络连接数据与每个粒子的M个中心数据Pdhg之间的距离;根据每个网络连接数据与每个粒子的M个中心数据Pdhg之间的距离的大小将所有网络连接数据分成M类,并根据n个数据点进行n次分类;计算每次分类中的所有网络连接数据到对应的中心数据Pdhg之间的距离和;判断N次分类中距离和最小的粒子;调整其他粒子的当前位置以及当前变化率;判断是否结束分类;将结果进行输出。

【技术实现步骤摘要】
网络连接数据分类方法
本专利技术具体涉及一种网络连接数据分类方法。
技术介绍
随着近年来互联网的爆炸式普及,网络已经深入人们的生活、娱乐和工作中。但互联网的开放性和安全性是一把双刃剑,它在给人们带来便利的同时,互联网的无主管性、跨国性、不设防性使得网络安全问题越来越突出。网络入侵检测是网络安全系统的重要组成部分,其对未经授权的使用、滥用网络资源的行为进行监控和响应,具有保护信息完整性、机密性作用。通常来说,网络入侵检测方法包括异常入侵检测和误用入侵检测方法。误用入侵检测方法认为异常行为和正常行为之间的交集很大,其检测结果与检测知识库完备性密切相关,不能发现新入侵行为,检测结果没有实际意义,因此异常入侵检测方法是当前网络入侵检测主要研究方向。异常检测是以网络的正常运行状态为基础,构造模型及规则来描述网络在正常情况下的各种特征。将当前网络特征发生较大偏差时来判断网络是否有异常或攻击存在。数据挖掘是异常入侵检测系统中当前最主要的网络入侵检测工具。数据挖掘主要对互联网的网络纪录进行分析,从中挖掘隐含的、实现未知的潜在有用信息,并用这些信息去检测异常入侵和已知的入侵。为了保证数据挖掘的准确率并减小误警率,需要事先构建准确的网络连接数据的分类,但是在构建数据分类的过程中,往往容易陷入局部最优的问题,造成分类相当不准确。
技术实现思路
本专利技术是为了解决上述问题而进行的,目的在于提供一种提高网络连接数据的分类准确率的网络连接数据分类方法。本专利技术提供了一种网络连接数据分类方法,用于对W个不同的网络连接数据进行分类,具有这样的特征,包括:步骤一,设定M个分类;步骤二,根据d个特征属性值设定一个d维求解空间;步骤三,在d维求解空间中随机生成N个粒子,并且对每一个粒子相应地设定M个d维的中心数据(Pdh1,Pdh2,···,PdhM)(h=1,···,N)作为粒子的当前位置、以及设定M个d维的变化率(vdh1,vdh2,···,vdhM)作为粒子的当前变化率,每个中心数据Pdhg(g=1,···,M)包含与d个特征属性值相呼应的d个粒子位置属性值,每个vdhg包含与d个粒子位置属性值相对应的d个中心粒子变化率;步骤四,分别计算每个网络连接数据与每个粒子的M个中心数据Pdhg之间的距离;步骤五,根据每个网络连接数据与每个粒子的M个中心数据Pdhg之间的距离的大小将所有网络连接数据分成M类,数据分类部对网络连接数据进行N次分类;步骤六,计算每次分类中的所有网络连接数据到对应的中心数据Pdhg之间的距离和;步骤七,判断N次分类中距离和最小的粒子,并设定该粒子为基准粒子;步骤八,调整除基准粒子外的其他粒子的当前位置以及当前变化率;步骤九,再次分别计算每个网络连接数据与每个粒子的M个中心数据Pdhg之间的距离;步骤十,再次根据每个网络连接数据与每个粒子的M个中心数据Pdhg之间的距离的大小将所有网络连接数据分成M类,并根据n个粒子对网络连接数据进行n次分类;步骤十一,再次计算每次所有网络连接数据到对应的中心数据Pdhg之间的距离和;步骤十二,判断调整的次数是否大于到预定次数,并判断相邻两次调整的距离和差值是否小于预定阈值;步骤十三,当两个判断中任意一个为是时,将基准粒子作为分类中心,M个中心数据Pdhg所在的分类作为最终分类进行输出;步骤十四,当判断均为否时,再次调整除基准粒子外的粒子的当前位置以及当前变化率,其中,N、M、W、d均为大于1的正整数,且W>M,N≥5M。在本专利技术提供的网络连接数据分类方法中,还可以具有这样的特征:其中,d个特征属性值含有连接时间、连接的数据包、网络服务类型、连接标记以及连接时的记录参数。在本专利技术提供的网络连接数据分类方法中,还可以具有这样的特征,还包括以下步骤:步骤十五,将基准粒子作为分类中心,M个中心数据Pdgh所在的分类作为最终分类进行存储。在本专利技术提供的网络连接数据分类方法中,还可以具有这样的特征:其中,步骤八包含以下步骤:步骤8-1,根据每个其他粒子的当前变化率调整每个其他粒子的当前位置,并根据基准粒子的当前变化率调整其他粒子的当前变化率。在本专利技术提供的网络连接数据分类方法中,还可以具有这样的特征:其中,步骤八还包含以下步骤:步骤8-2,在位置变化率调整单元调整其他粒子的当前位置和当前变化率后,选取N个粒子中任意Z个粒子并将Z个粒子中任意两个粒子的当前位置以及当前变化率进行交叉运算生成第一交叉位置以及第一交叉变化率,5%×N≤Z≤40%×N,Z为正整数。在本专利技术提供的网络连接数据分类方法中,还可以具有这样的特征:其中,步骤八还包含以下步骤:步骤8-3,选择当前基准粒子作为父本;步骤8-4,选取进行交叉运算后的N个粒子中任意k个粒子,并将父本的当前位置以及当前变化率与被选取的粒子的当前位置以及当前变化率分别叠加;步骤8-5,将叠加后的所有粒子不重复地两两配对,并再次执行交叉运算生成第二交叉位置以及第二交叉变化率;以及步骤8-6,对每个生成的第二交叉位置以及第二交叉变化率的空间粒子进行变异运算重新生成作为变异位置的当前位置以及作为变异变化率的当前变化率,5%×N≤k≤14%×N,k为正整数。在本专利技术提供的网络连接数据分类方法中,还可以具有这样的特征:其中,交叉运算的运算公式如下:其中,iter代表当前生成位置和变化率的调整次数,x1,x2,v1,v2分别代表选择交叉运算前的两个粒子的当前位置和当前变化率,分别代表选择交叉运算后的两个粒子的当前位置和当前变化率。在本专利技术提供的网络连接数据分类方法中,还可以具有这样的特征:其中,变异运算的运算公式如下:ck是区间上均匀分布的随机数,xL,xU分别是可行区间的边界,fit代表适应度函数。在本专利技术提供的网络连接数据分类方法中,还可以具有这样的特征:其中,步骤三中所生成的粒子是用于为W个网络连接数据进行M种分类而使用的代理观测量。专利技术的作用与效果根据本专利技术所涉及的网络连接数据分类方法,因为具有以下步骤:设定M个分类;根据d个特征属性值设定一个d维求解空间;在d维求解空间中随机生成N个粒子;分别计算每个网络连接数据与每个粒子的M个中心数据Pdhg之间的距离;根据每个网络连接数据与每个粒子的M个中心数据Pdhg之间的距离的大小将所有网络连接数据分成M类,并根据n个数据点进行n次分类;计算每次分类中的所有网络连接数据到对应的中心数据Pdhg之间的距离和;判断N次分类中距离和最小的粒子;调整其他粒子的当前位置以及当前变化率;判断是否结束分类;将结果进行输出,所以,本专利技术的网络连接数据分类方法可以准确地对网络连接数据进行分类,而且具有更高的检测率和更低的误报率,且具有较好的收敛性。不仅如此,本专利技术的网络连接数据分类方法还可以用于对运营数据的异常数据、证券交易数据的异常数据进行准确分类,并有效检测判断出异常数据。附图说明图1是本专利技术的实施例中网络连接数据分类系统的框图;图2是本专利技术的实施例中网络连接数据分类方法的流程图;图3是本专利技术的实施例中位置和变化率调整部的动作流程图;以及图4是本专利技术的实施例中网络连接数据分类方法的分类效果图。具体实施方式为了使本专利技术实现的技术手段、创作特征、达成目的与功效易于明白了解,以下实施例结合附图对本专利技术网络连接数据分类方法作具体阐述。本文档来自技高网...
网络连接数据分类方法

【技术保护点】
一种网络连接数据分类方法,用于对E个不同的网络连接数据进行分类,每个所述网络连接数据含有d个特征属性值,其特征在于,包括以下步骤:步骤一,设定M个分类;步骤二,根据所述d个特征属性值设定一个d维求解空间;步骤三,在所述d维求解空间中随机生成N个粒子,并且对每一个所述粒子相应地设定M个d维的中心数据(Pdh1,Pdh2,…,PdhM)(h=1,…,N)作为所述粒子的当前位置、以及设定M个d维的变化率(vdh1,vdh2,…,vdhM)作为所述粒子的当前变化率,每个中心数据Pdhg(g=1,…,M)包含与所述d个特征属性值相呼应的d个粒子位置属性值,每个vdhg包含与所述d个粒子位置属性值相对应的d个中心粒子变化率;步骤四,分别计算每个所述网络连接数据与每个所述粒子的M个中心数据Pdhg之间的距离;步骤五,根据每个所述网络连接数据与每个所述粒子的M个中心数据Pdhg之间的所述距离的大小将所有所述网络连接数据分成M类,并根据N个粒子对所述网络连接数据进行N次分类;步骤六,计算每次分类中的所有所述网络连接数据到对应的中心数据Pdhg之间的距离和;步骤七,判断N次分类中所述距离和最小的粒子,并设定该粒子为基准粒子;步骤八,调整除所述基准粒子外的其他粒子的当前位置以及当前变化率;步骤九,再次分别计算每个所述网络连接数据与每个所述粒子的M个中心数据Pdhg之间的距离;步骤十,再次根据每个所述网络连接数据与每个所述粒子的M个中心数据Pdhg之间的所述距离的大小将所有所述网络连接数据分成M类,所述数据分类部再次对所述网络连接数据进行n次分类;步骤十一,再次计算每次所有所述网络连接数据到对应的中心数据Pdhg之间的距离和;步骤十二,判断调整的次数是否大于预定次数,并判断相邻两次调整的距离和差值是否小于预定阈值;步骤十三,当两个判断中任意一个为是时,将所述基准粒子作为分类中心,M个中心数据Pdhg所在的分类作为最终分类进行输出;步骤十四,当判断均为否时,再次调整除所述基准粒子外的粒子的当前位置以及当前变化率,其中,N、M、W、d均为大于1的正整数,且W>M,N≥5M。...

【技术特征摘要】
2017.08.31 CN 20171076839491.一种网络连接数据分类方法,用于对E个不同的网络连接数据进行分类,每个所述网络连接数据含有d个特征属性值,其特征在于,包括以下步骤:步骤一,设定M个分类;步骤二,根据所述d个特征属性值设定一个d维求解空间;步骤三,在所述d维求解空间中随机生成N个粒子,并且对每一个所述粒子相应地设定M个d维的中心数据(Pdh1,Pdh2,…,PdhM)(h=1,…,N)作为所述粒子的当前位置、以及设定M个d维的变化率(vdh1,vdh2,…,vdhM)作为所述粒子的当前变化率,每个中心数据Pdhg(g=1,…,M)包含与所述d个特征属性值相呼应的d个粒子位置属性值,每个vdhg包含与所述d个粒子位置属性值相对应的d个中心粒子变化率;步骤四,分别计算每个所述网络连接数据与每个所述粒子的M个中心数据Pdhg之间的距离;步骤五,根据每个所述网络连接数据与每个所述粒子的M个中心数据Pdhg之间的所述距离的大小将所有所述网络连接数据分成M类,并根据N个粒子对所述网络连接数据进行N次分类;步骤六,计算每次分类中的所有所述网络连接数据到对应的中心数据Pdhg之间的距离和;步骤七,判断N次分类中所述距离和最小的粒子,并设定该粒子为基准粒子;步骤八,调整除所述基准粒子外的其他粒子的当前位置以及当前变化率;步骤九,再次分别计算每个所述网络连接数据与每个所述粒子的M个中心数据Pdhg之间的距离;步骤十,再次根据每个所述网络连接数据与每个所述粒子的M个中心数据Pdhg之间的所述距离的大小将所有所述网络连接数据分成M类,所述数据分类部再次对所述网络连接数据进行n次分类;步骤十一,再次计算每次所有所述网络连接数据到对应的中心数据Pdhg之间的距离和;步骤十二,判断调整的次数是否大于预定次数,并判断相邻两次调整的距离和差值是否小于预定阈值;步骤十三,当两个判断中任意一个为是时,将所述基准粒子作为分类中心,M个中心数据Pdhg所在的分类作为最终分类进行输出;步骤十四,当判断均为否时,再次调整除所述基准粒子外的粒子的当前位置以及当前变化率,其中,N、M、W、d均为大于1的正整数,且W>M,N≥5M。2.根据权利要求1所述的网络连接数据分类方法,其特征在于:其中,d个所述特征属性值含有连接时间、连接的数据包、网络服务类型、连接标记以及连接时的记录参数。3.根据权利要求1所述的网络连接数据分类方法,其特征在于,还包括以下步骤:步骤十五,将所述基准粒子作为分类中心,M个中心数据Pdgh所在的分类作为最终分类进行存储。4.根据权利要求1所述的网络连接数据分类方法,其特征在于:其中,步骤八包含以下步骤:步骤8-1,根据每个所述其他粒子的所述当前变化率调整每个所述其他粒子的当前位置,并根据所述基准粒...

【专利技术属性】
技术研发人员:韩景倜梁贺君袁光辉
申请(专利权)人:上海财经大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1