基于指纹相似度的设备分类方法技术

技术编号:22565593 阅读:17 留言:0更新日期:2019-11-16 12:14
本发明专利技术公开了一种基于指纹相似度的设备分类方法,包括:建立已知的同一类型设备的样本集,提取样本集对应的指纹信息,以得平均相似度和中心点样本指纹集;获取样本集内的每个设备与中心点样本指纹集的相似度,计算每个已知类型设备指纹信息相似度到中心点样本指纹集的相似距离,确定最大相似距离;计算未知类型设备集内每个样本与中心点样本指纹集所在的中心点样本的空间距离,若大于最大相似距离,则样本属于中心点样本集所在的样本类型,否则,样本不属于样本类型,若出现未正确识别样本,重新加入样本集,重新计算中心点样本,以完成自动分类。本发明专利技术提高了设备分类的效率和准确性,并避免了因信息发送变化导致的指纹识别失败的问题。

Device classification method based on fingerprint similarity

The invention discloses a device classification method based on fingerprint similarity, which includes: establishing a known sample set of the same type of device, extracting the fingerprint information corresponding to the sample set to obtain the average similarity and the center point sample fingerprint set; obtaining the similarity between each device in the sample set and the center point sample fingerprint set, and calculating the similarity of each known type of device fingerprint information to The similarity distance of the center point sample fingerprint set is determined to determine the maximum similarity distance; the space distance between each sample in the unknown type device set and the center point sample where the center point sample fingerprint set is located is calculated. If the distance is greater than the maximum similarity distance, the sample belongs to the sample type where the center point sample set is located. Otherwise, the sample does not belong to the sample type. If the sample is not correctly identified, add it again Sample set, recalculate the center point sample to complete the automatic classification. The invention improves the efficiency and accuracy of device classification, and avoids the problem of fingerprint identification failure caused by the change of information transmission.

【技术实现步骤摘要】
基于指纹相似度的设备分类方法
本专利技术涉及数据处理
,尤其涉及一种基于指纹相似度的设备分类方法。
技术介绍
随着对网络安全的日渐深入,对于网络资产的梳理变得越来越重要,其中,包括网络设备的操作系统类型、开放的服务、banner信息、证书信息、使用的中间件、Http响应头信息等多个维度的综合信息描述,对设备进行分类和识别。但是随着网络设备、软件的不断更新,应用层协议指纹更新更是层出不穷,传统的指纹识别大多采用单条件逐个匹配,如果中间某一个信息发生变化,则会导致指纹识别失败,采用基于相似度的分类算法则可解决此问题。
技术实现思路
本专利技术的一个目的是解决至少上述问题,并提供至少后面将说明的优点。本专利技术还有一个目的是提供一种基于指纹相似度的设备分类方法,提高了设备分类的效率和准确性,并避免了因信息发送变化,导致的指纹识别失败的问题。为了实现根据本专利技术的这些目的和其它优点,提供了一种基于指纹相似度的设备分类方法,包括:步骤1、通过建立已知的同一类型设备的样本集,并提取所述样本集对应的指纹信息,以得到所述指纹信息的平均相似度和中心点样本指纹集。步骤2、通过获取所述样本集内的每个设备与步骤1所得中心点样本指纹集的相似度,计算每个已知类型设备指纹信息所述相似度到所述中心点样本指纹集的相似距离,并确定最大相似距离。步骤3、通过计算未知类型设备集内每个样本与所述中心点样本指纹集所在的中心点样本的空间距离,与所述最大相似距离进行比较,若大于所述最大相似距离,则所述样本属于所述中心点样本集所在的样本类型,否则,所述样本不属于所述样本类型,若出现未正确识别的样本,则进入步骤4。步骤4、通过将未正确识别的样本重新加入所述样本集,以重新计算所述中心点样本,重复步骤1-3,以完成自动分类。优选的是,步骤1中,所述指纹信息的平均相似度和中心点样本指纹集的具体方法主要包括以下步骤:步骤2.1、通过多个已知的同一类型的设备建立样本集N,提取所述样本集N内每个设备对应的指纹信息。步骤2.2、通过计算所述样本集N内每个设备指纹信息对应属性的相似度,取所述相似度的平均值作为平均相似度。步骤2.3、获取所述相似度中与所述平均值接近的多个相似度作为所述中心点样本指纹集。优选的是,步骤2中,获取所述相似度的具体方法主要包括以下步骤:步骤3.1、获取所述样本集内设备对应的多个维度信息,计算与所述中心点样本指纹集的相似度。步骤3.2、对所述样本集内处所述中心点样本之外的所述设备重复步骤3.1,直至得到除所述中心点样本之外的所有的每个所述设备的相似度。优选的是,步骤2中,获取所述相似距离的计算方法依据公式1:公式1其中,X(i)为样本对应的多个维度信息与所述中心点样本指纹集的相似度;K(i)为一类型设备的k个指纹与该类型设备中心点样本指纹集的所述平均相似度;D为样本集N内除所述中心点样本之外的所述样本与所述中心点样本的最大相似距离。优选的是,步骤3中所述空间距离的计算方法依据公式2:公式2其中,A(i)为未知类型的样本集A中样本对应的多个维度信息与所述中心点样本指纹集的相似度;d为所述空间距离。优选的是,所述未正确识别的样本加入所述样本集的前提是,所述未正确识别的样本类型设定为与所述样本集内样本类型相同。本专利技术至少包括以下有益效果:通过建立样本集,样本集内的每个设备均已知其类型,提取每个已知类型的设备对应的指纹信息,以作为相似度对比的依据,每个设备对应的指纹信息具有唯一性,使实现自动分类的有效基础,同时便于求得平均相似度和中心点样本指纹集;中心点样本指纹集是样本集内每个设备参照的依据,通过获取每个设备的多维度信息与中心点样本指纹集的相似度,从而再以平均相似度为参照,计算得每个相似度到平均相似度的相似距离,并比较所述相似距离,以得到最大相似距离作为阈值,作为未知类型设备样本判断其类型的主要依据,落入所述最大相似距离内的空间距离,可判定该未知类型的样本与样本集类型相同,未落入所述最大相似距离内的空间距离,可判定该未知类型的样本与样本集类型不同;还包括未正确识别的样本,指的是设定相似度值大于样本集内设定的最小相似度,导致判定不精确,此时,需要通过人为干预的方式,设定未正确识别的样本类型与样本集内已知设备的类型相同,从而将其加入到样本集内,建立新的样本集,并重新计算中心点样本,以实现往复循环的自动分类,直至自动分类结束。所述基于指纹相似度的设备分类方法可有效解决因应用层协议指纹更新导致的指纹识别失败的问题,提高了设备分类的效率和准确性。本专利技术的其它优点、目标和特征将部分通过下面的说明体现,部分还将通过对本专利技术的研究和实践而为本领域的技术人员所理解。附图说明图1为本专利技术所述基于指纹相似度的设备分类方法的流程图。具体实施方式下面结合附图对本专利技术做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。应当理解,本文所使用的诸如“具有”、“包含”以及“包括”术语并不排除一个或多个其它元件或其组合的存在或添加。如图1所示,本专利技术提供一种基于指纹相似度的设备分类方法,包括:步骤1、通过建立已知的同一类型设备的样本集,并提取所述样本集对应的指纹信息,以得到所述指纹信息的平均相似度和中心点样本指纹集。步骤2、通过获取所述样本集内的每个设备与步骤1所得中心点样本指纹集的相似度,计算每个已知类型设备指纹信息所述相似度到所述中心点样本指纹集的相似距离,并确定最大相似距离。步骤3、通过计算未知类型设备集内每个样本与所述中心点样本指纹集所在的中心点样本的空间距离,与所述最大相似距离进行比较,若大于所述最大相似距离,则所述样本属于所述中心点样本集所在的样本类型,否则,所述样本不属于所述样本类型,若出现未正确识别的样本,则进入步骤4。步骤4、通过将未正确识别的样本重新加入所述样本集,以重新计算所述中心点样本,重复步骤1-3,以完成自动分类。在上述方案中,通过建立样本集,样本集内的每个设备均已知其类型,提取每个已知类型的设备对应的指纹信息,以作为相似度对比的依据,每个设备对应的指纹信息具有唯一性,使实现自动分类的有效基础,同时便于求得平均相似度和中心点样本指纹集;中心点样本指纹集是样本集内每个设备参照的依据,通过获取每个设备的多维度信息与中心点样本指纹集的相似度,从而再以平均相似度为参照,计算得每个相似度到平均相似度的相似距离,并比较所述相似距离,以得到最大相似距离作为阈值,作为未知类型设备样本判断其类型的主要依据,落入所述最大相似距离内的空间距离,可判定该未知类型的样本与样本集类型相同,未落入所述最大相似距离内的空间距离,可判定该未知类型的样本与样本集类型不同;还包括未正确识别的样本,指的是设定相似度值大于样本集内设定的最小相似度,导致判定不精确,此时,需要通过人为干预的方式,设定未正确识别的样本类型与样本集本文档来自技高网...

【技术保护点】
1.一种基于指纹相似度的设备分类方法,其中,主要包括以下步骤:/n步骤1、通过建立已知的同一类型设备的样本集,并提取所述样本集对应的指纹信息,以得到所述指纹信息的平均相似度和中心点样本指纹集;/n步骤2、通过获取所述样本集内的每个设备与步骤1所得中心点样本指纹集的相似度,计算每个已知类型设备指纹信息所述相似度到所述中心点样本指纹集的相似距离,并确定最大相似距离;/n步骤3、通过计算未知类型设备集内每个样本与所述中心点样本指纹集所在的中心点样本的空间距离,与所述最大相似距离进行比较,若大于所述最大相似距离,则所述样本属于所述中心点样本集所在的样本类型,否则,所述样本不属于所述样本类型,若出现未正确识别的样本,则进入步骤4;/n步骤4、通过将未正确识别的样本重新加入所述样本集,以重新计算所述中心点样本,重复步骤1-3,以完成自动分类。/n

【技术特征摘要】
1.一种基于指纹相似度的设备分类方法,其中,主要包括以下步骤:
步骤1、通过建立已知的同一类型设备的样本集,并提取所述样本集对应的指纹信息,以得到所述指纹信息的平均相似度和中心点样本指纹集;
步骤2、通过获取所述样本集内的每个设备与步骤1所得中心点样本指纹集的相似度,计算每个已知类型设备指纹信息所述相似度到所述中心点样本指纹集的相似距离,并确定最大相似距离;
步骤3、通过计算未知类型设备集内每个样本与所述中心点样本指纹集所在的中心点样本的空间距离,与所述最大相似距离进行比较,若大于所述最大相似距离,则所述样本属于所述中心点样本集所在的样本类型,否则,所述样本不属于所述样本类型,若出现未正确识别的样本,则进入步骤4;
步骤4、通过将未正确识别的样本重新加入所述样本集,以重新计算所述中心点样本,重复步骤1-3,以完成自动分类。


2.如权利要求1所述基于指纹相似度的设备分类方法,其中,步骤1中,所述指纹信息的平均相似度和中心点样本指纹集的具体方法主要包括以下步骤:
步骤2.1、通过多个已知的同一类型的设备建立样本集N,提取所述样本集N内每个设备对应的指纹信息;
步骤2.2、通过计算所述样本集N内每个设备指纹信息对应属性的相似度,取所述相似度的平均值作为平均相似度;
步骤2.3、获取所述相似度中与所述平均值接近的多个相似度作为所述中心...

【专利技术属性】
技术研发人员:林星辰黄元飞李燕伟夏剑锋张峰权晓文王润合黄石海赵建聪
申请(专利权)人:国家计算机网络与信息安全管理中心远江盛邦北京网络安全科技股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1