一种分类方法及电子设备技术

技术编号:13431363 阅读:46 留言:0更新日期:2016-07-30 03:45
本发明专利技术公开了一种分类方法及电子设备,所述分类包括:确定网络中的至少一个结点;获得所述至少一个结点中任意两个结点间的通信信息;基于所述任意两个结点间的通信信息,构造与所述至少一个结点对应的连接图;基于所述连接图与所述任意两个结点间的通信信息,确定所述至少一个结点中任意两个结点的相似性,确定相似性矩阵;采用谱聚类算法对所述相似性矩阵进行谱聚类,获得聚类结果。本发明专利技术提供的上述方法,解决现有技术中存在流量分类方法复杂的技术问题。

Classification method and electronic equipment

The invention discloses a classification method and the classification of electronic equipment, including: determining at least one node in the network; obtain the at least any node in the information communication between two nodes; the information communication between any two nodes based on the graph structure and the at least one a node; the connecting communication information graph and the two nodes on the basis of the determination of similarity of any of the at least one node in the two node, determining a similarity matrix; using spectral clustering algorithm of the similarity matrix for spectral clustering. The clustering result is obtained. The method provided by the invention solves the technical problems of the existing traffic classification method in the prior art.

【技术实现步骤摘要】

本专利技术涉及电子
,特别涉及一种分类方法及电子设备
技术介绍
流量分类技术在网络测量与信息安全领域应用非常广泛,一方面,根据应用实时性要求优化网络通信资源;另一方面,实时流量分类提前识别并监控网络异常流量。传统的网络流量识别技术主要有基于端口识别与深度数据包检测的协议识别方法,随着P2P技术的不断发展,对等网络已被广泛应用于文件共享、即时通信、流媒体传输等领域,以及其他新兴互联网业务的应用,大量动态端口及协议加密技术被用于数据传输,导致基于端口和深度报文检测的流量分类方法逐步失效。为了不依赖于报文负载进行检测,基于机器学习的流量分类技术正逐步受到研究者的关注。它通过提取网络流的统计特征(如平均报文长度、流的持续时间等),将网络流抽象为由一组统计特征值构成的属性向量,实现了由流量分类向机器学习的转化。基于机器学习的流量分类方法存在以下缺陷:一是高速网络中,提取流量特征的时间复杂度随所统计的报文数量线性增加;二是概念飘移问题,导致这种现象的原因是网络时空环境和网络应用分布发生变化。针对机器学习方法重度依赖网络环境和计算复杂度偏高的问题,用户级的流量分类方法不再关注应用层负载、流量特征的提取和统计,而是从用户行为学的角度进行研究。现有技术中可以分别从社会、功能、应用3个层面分析了各种应用的行为模式,提出了基于“用户交互行为”的流量分类方法。但这样的分类方法对于新出现的业务模式无能为力,并且计算复杂度较高,耗时长,必须进行离线分析。所以,现有技术中存在流量分类方法复杂获的技术问题。
技术实现思路
本专利技术实施例提供一种分类方法及电子设备,用于解决现有技术中存在流量分类方法复杂的技术问题。本专利技术实施例一方面提供了一种分类方法,包括:确定网络中的至少一个结点;获得所述至少一个结点中任意两个结点间的通信信息;基于所述任意两个结点间的通信信息,构造与所述至少一个结点对应的连接图;基于所述连接图与所述任意两个结点间的通信信息,确定所述至少一个结点中任意两个结点的相似性,确定相似性矩阵;采用谱聚类算法对所述相似性矩阵进行谱聚类,获得聚类结果。可选的,所述确定网络中的至少一个结点,具体为:基于网络地址与端口信息确定所述网络中的至少一个结点。可选的,所述获得所述至少一个结点中任意两个结点间的通信信息,具体为:获得在预设时间范围内所述至少一个结点中任意两个结点间的通信连接关系和传输的报文总数。可选的,所述基于所述任意两个结点间的通信信息,构造与所述至少一个结点对应的连接图,具体包括:获得所述至少一个结点中任意的第i结点与第j结点间通信连接关系;基于所述通信连接关系,确定所述第i结点与所述第j结点间的边连接关系;基于获得的所述任意的第i结点与第j结点间的边连接关系,确定所述至少一个结点对应的连接图。可选的,所述基于所述通信连接关系,确定所述第i结点与所述第j结点间的边连接关系,具体包括:若所述第i结点与所述第j结点间成功建立UDP连接,确定所述第i结点与所述第j结点间存在边连接;或若所述第i结点与所述第j结点间成功建立TCP连接,确定所述第i结点与所述第j结点间存在边连接;或若所述第i结点与所述第j结点间传输的报文总数大于预设阈值,确定所述第i结点与所述第j结点间存在边连接。可选的,所述基于所述连接图与所述任意两个结点间的通信信息,确定所述至少一个结点中任意两个结点的相似性,具体包括:基于所述连接图,确定所述第i结点与所述第j结点是否为相邻结点;如果是,则基于所述第i结点与所述第j结点间传输的报文总数确定所述所述第i结点与所述第j结点的相似性;如果否,则获得所述第i结点的相邻结点集与所述第j结点的相邻结点集间的并集,基于所述并集中的结点与所述第i结点和所述第j结点间的传输报文信息,确定所述所述第i结点与所述第j结点的相似性。本专利技术实施例另一方面提供一种电子设备,包括:存储单元,用于存储至少一个程序模块;至少一个处理器,所述至少一个处理器通过获得并运行所述至少一个程序模块,用于确定网络中的至少一个结点;获得所述至少一个结点中任意两个结点间的通信信息;基于所述任意两个结点间的通信信息,构造与所述至少一个结点对应的连接图;基于所述连接图与所述任意两个结点间的通信信息,确定所述至少一个结点中任意两个结点的相似性,确定相似性矩阵;采用谱聚类算法对所述相似性矩阵进行谱聚类,获得聚类结果。可选的,所述至少一个处理器还用于:基于网络地址与端口信息确定所述网络中的至少一个结点。可选的,所述至少一个处理器还用于:获得在预设时间范围内所述至少一个结点中任意两个结点间的通信连接关系和传输的报文总数。可选的,所述至少一个处理器还用于:获得所述至少一个结点中任意的第i结点与第j结点间通信连接关系;基于所述通信连接关系,确定所述第i结点与所述第j结点间的边连接关系;基于获得的所述任意的第i结点与第j结点间的边连接关系,确定所述至少一个结点对应的连接图。可选的,所述至少一个处理器还用于:若所述第i结点与所述第j结点间成功建立UDP连接,确定所述第i结点与所述第j结点间存在边连接;或若所述第i结点与所述第j结点间成功建立TCP连接,确定所述第i结点与所述第j结点间存在边连接;或若所述第i结点与所述第j结点间传输的报文总数大于预设阈值,确定所述第i结点与所述第j结点间存在边连接。可选的,所述至少一个处理器还用于:基于所述连接图,确定所述第i结点与所述第j结点是否为相邻结点;如果是,则基于所述第i结点与所述第j结点间传输的报文总数确定所述所述第i结点与所述第j结点的相似性;如果否,则获得所述第i结点的相邻结点集与所述第j结点的相邻结点集间的并集,基于所述并集中的结点与所述第i结点和所述第j结点间的传输报文信息,确定所述所述第i结点与所述第j结点的相似性。本专利技术实施例另一方面提供一种电子设备,包括:第一确定单元,用于确定网络中的至少一个结点;第一获得单元,用于获得所述至少一个结点中任意两个结点间的通信信息;第一构造单元,用于基于所述任意两个结点间的通信信息,构造与所述至少一个结点对应的连接图;第二确定单元,用于基于所述连接图与所述任意两个结点间的通信信息,确定所述至少一个结点中任意两个结点的相似性,确定相似性矩阵;第一分类单元,本文档来自技高网
...

【技术保护点】
一种分类方法,包括:确定网络中的至少一个结点;获得所述至少一个结点中任意两个结点间的通信信息;基于所述任意两个结点间的通信信息,构造与所述至少一个结点对应的连接图;基于所述连接图与所述任意两个结点间的通信信息,确定所述至少一个结点中任意两个结点的相似性,确定相似性矩阵;采用谱聚类算法对所述相似性矩阵进行谱聚类,获得聚类结果。

【技术特征摘要】
1.一种分类方法,包括:
确定网络中的至少一个结点;
获得所述至少一个结点中任意两个结点间的通信信息;
基于所述任意两个结点间的通信信息,构造与所述至少一个结点对应的连
接图;
基于所述连接图与所述任意两个结点间的通信信息,确定所述至少一个结
点中任意两个结点的相似性,确定相似性矩阵;
采用谱聚类算法对所述相似性矩阵进行谱聚类,获得聚类结果。
2.如权利要求1所述的分类方法,其特征在于,所述确定网络中的至少
一个结点,具体为:
基于网络地址与端口信息确定所述网络中的至少一个结点。
3.如权利要求1所述的分类方法,其特征在于,所述获得所述至少一个
结点中任意两个结点间的通信信息,具体为:
获得在预设时间范围内所述至少一个结点中任意两个结点间的通信连接
关系和传输的报文总数。
4.如权利要求3所述的分类方法,其特征在于,所述基于所述任意两个
结点间的通信信息,构造与所述至少一个结点对应的连接图,具体包括:
获得所述至少一个结点中任意的第i结点与第j结点间通信连接关系;
基于所述通信连接关系,确定所述第i结点与所述第j结点间的边连接关
系;
基于获得的所述任意的第i结点与第j结点间的边连接关系,确定所述至
少一个结点对应的连接图。
5.如权利要求4所述的分类方法,其特征在于,所述基于所述通信连接
关系,确定所述第i结点与所述第j结点间的边连接关系,具体包括:
若所述第i结点与所述第j结点间成功建立UDP连接,确定所述第i结点

\t与所述第j结点间存在边连接;或
若所述第i结点与所述第j结点间成功建立TCP连接,确定所述第i结点
与所述第j结点间存在边连接;或
若所述第i结点与所述第j结点间传输的报文总数大于预设阈值,确定所
述第i结点与所述第j结点间存在边连接。
6.如权利要求4所述的分类方法,其特征在于,所述基于所述连接图与
所述任意两个结点间的通信信息,确定所述至少一个结点中任意两个结点的相
似性,具体包括:
基于所述连接图,确定所述第i结点与所述第j结点是否为相邻结点;
如果是,则基于所述第i结点与所述第j结点间传输的报文总数确定所述
所述第i结点与所述第j结点的相似性;
如果否,则获得所述第i结点的相邻结点集与所述第j结点的相邻结点集
间的并集,基于所述并集中的结点与所述第i结点和所述第j结点间的传输报
文信息,确定所述所述第i结点与所述第j结点的相似性。
7.一种电子设备,包括:
存储单元,用于存储至少一个程序模块;
至少一个处理器,所述至少一个处理器通过获得并运行所述至少一个程序
模块,用于确定网络中的至少一个结点;...

【专利技术属性】
技术研发人员:杨芳勋
申请(专利权)人:四川九洲电器集团有限责任公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1