一种IP组相似度计算方法技术

技术编号：17165036 阅读：36 留言：0更新日期：2018-02-01 22:31

本发明专利技术涉及一种IP组相似度计算方法，取任一IP，得到IP的本身字段属性、地域信息属性、告警时间属性和告警类型属性的高维特征向量，加权组合得到当前IP的组合特征向量，进而得到所有待分组IP的组合特征向量，聚类得到IP组，以均方根误差RMSE衡量每个IP组的相似度。本发明专利技术的方法考量了IP的多维属性，结合IP本身的字段、地域特征及行为模式，得到IP组相似度更有说服力，精准度更高。

A method for calculating the similarity of IP group

The invention relates to a calculation method of IP group similarity, take any IP, high dimensional feature vector field itself attribute, geographical information attribute, the alarm time and alarm attribute type attribute to get IP, a combined feature vector of current IP weighted combination, and then get all IP components combined feature vector clustering, IP group similarity with root mean square error RMSE measure of each group IP. The method of the invention considers the multi-dimensional attributes of IP, and combines the field, regional characteristics and behavior patterns of IP to get the similarity of IP group, which is more convincing and accurate.

全部详细技术资料下载

【技术实现步骤摘要】
一种IP组相似度计算方法
本专利技术涉及特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法的
，特别涉及一种网络安全领域的、基于高维映射和加权K-Means聚类的IP组相似度计算方法。
技术介绍
IP是InternetProtocol(互联网协议)的外语缩写，在互联网中，它是能使连接到网上的所有计算机网络实现相互通信的一套规则，规定了计算机在互联网上进行通信时应当遵守的规则。任何厂家生产的计算机系统，只要遵守IP协议就可以在互联网上互连互通。通过计算IP间的相似度，可以使分析视角从单个IP转到整个IP组，从而为IP行为分析和规律发现提供了便利，进而可以更好地保障网络安全。在现有技术中，IP相似度计算方法是直接根据IP(一般表示为A.B.C.D)本身的4个字段信息，采用聚类方法如DBSCAN、K-Medoids等进行聚类，然后计算IP组相似度，这些聚类方法只考虑了单一的IP字段信息，没有利用IP的其他属性及行为特征，所以聚类效果不尽如人意。
技术实现思路
本专利技术的主要目的在于克服现有技术中的不足，提供一种优化的IP组相似度计算方法。本专利技术的技术方...

【技术保护点】
一种IP组相似度计算方法，其特征在于：所述方法包括以下步骤：步骤1：取任一IP，所述IP的属性包括IP的本身字段属性、IP的地域信息属性、IP的告警时间属性和IP的告警类型属性；将IP同一属性的字段取值统一到同一高维空间，得到IP的本身字段属性的高维特征向量V1、IP的地域信息属性的高维特征向量V2、IP的告警时间属性的高维特征向量V3和IP的告警类型属性的高维特征向量V4；步骤2：对得到的高维特征向量进行加权，组合得到当前IP的组合特征向量V＝[λ1.*V1,λ2.*V2,λ3×V3,λ4×V4]，其中，.*表示向量的对应元素相乘，λ1和λ2为权重向量，λ1和λ2中的每个元素的取值范围为[1...

【技术特征摘要】
1.一种IP组相似度计算方法，其特征在于：所述方法包括以下步骤：步骤1：取任一IP，所述IP的属性包括IP的本身字段属性、IP的地域信息属性、IP的告警时间属性和IP的告警类型属性；将IP同一属性的字段取值统一到同一高维空间，得到IP的本身字段属性的高维特征向量V1、IP的地域信息属性的高维特征向量V2、IP的告警时间属性的高维特征向量V3和IP的告警类型属性的高维特征向量V4；步骤2：对得到的高维特征向量进行加权，组合得到当前IP的组合特征向量V＝[λ1.*V1,λ2.*V2,λ3×V3,λ4×V4]，其中，.*表示向量的对应元素相乘，λ1和λ2为权重向量，λ1和λ2中的每个元素的取值范围为[1,100],λ3和λ4为权重值，λ3、λ4∈[1,100]；步骤3：重复步骤1至步骤2，得到NIP个待分组IP的组合特征向量V后，进行下一步；步骤4：利用K-Means算法，将所有待分组IP进行聚类，得到K个IP组，其中，β为参数，β∈[1,50]；步骤5：以均方根误差RMSE衡量每个IP组的相似度。2.根据权利要求1所述的一种IP组相似度计算方法，其特征在于：所述得到IP的本身字段属性的高维特征向量包括以下步骤：步骤1.1.1：令所述IP为标准格式A.B.C.D，其中，A、B、C、D为字段，A、B、C、D∈[0,255]；步骤1.1.2：所述IP的字段映射到高维空间的高维特征向量为V1＝(A,B,C,D)；步骤1.1.3：归一化所得向量，得到步骤1.1.4：以V1'代替V1。3.根据权利要求1所述的一种IP组相似度计算方法，其特征在于：所述得到IP的地域信息属性的高维特征向量包括以下步骤：步骤1.2.1：取所述IP的经纬度信息，经度longitude∈[-180°,180°]，纬度...

【专利技术属性】
技术研发人员：莫凡，范渊，刘博，
申请(专利权)人：杭州安恒信息技术有限公司，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人