【技术实现步骤摘要】
一种用于IP定位的网络实体识别方法
[0001]本专利技术涉及网络实体识别的
,尤其涉及一种用于IP定位的网络实体识别方法,是在大图网络结构下的一种用于IP定位的网络实体识别方法。
技术介绍
[0002]网络空间测绘是对于网络中的各个空间资源的探测、分析和绘制。其中网络空间资产分析为主要,分为实体资源分析和虚拟资源分析,网络实体识别和IP定位属于实体资源分析,分别为IP对网络实体类型的映射和IP对网络实体位置的映射。
[0003]网络实体是指联网设备的统称,指具有IP地址且在网络空间中能够进行通信的设备。网络实体定位技术是通过网络空间中目标实体的IP地址,其主要结合目标IP的时延、拓扑等相关特征,获取目标实体所在的位置,也称IP定位,在许多领域有着广泛的应用。IP定位技术主要分为基于数据库的方法、基于规则的方法和基于学习的方法。基于数据库可以通过简单的查询比对获取网络实体的位置;基于规则的方法通过构建基于网络的规则方法实现对网络实体的定位约束;基于学习的方法包括使用机器学习、深度学习和图神经网络学习提取目标节点的特征信息和拓扑的结构信息,建立节点与地标的相似性判断,实现网络实体定位。
[0004]基于数据库的方法可以根据多种数据混合查询的方式获取IP定位,Lee Y等人提出了一种新的IP地址数据库的创建方法,基于带有该位置标签的众包互联网宽带性能测量。赵等人提出了一种新颖的方法来校准位置数据库,使用各种分类器并采用时间延迟作为特征来自动显示距离与时间延迟之间的关系。基于规则的方法:Liu等人提出 ...
【技术保护点】
【技术特征摘要】
1.一种用于IP定位的网络实体识别方法,其特征在于,其步骤如下:步骤一、数据处理:提取网络实体的IPv6地址,并获取路径信息得到数据集;对数据集进行特征提取和匿名处理,筛选得到属性特征,将属性特征嵌入至网络拓扑图中;步骤二、子图划分:通过社区聚类方法对网络拓扑图进行社区划分,得到若干个子图;步骤三、注意力权重计算:提取子图中节点的结构信息并计算结构相似度,对子图所有节点进行Transformer计算,计算节点的综合权重注意力;步骤四、节点更新:根据节点间的综合权重注意力选取节点进行聚合更新,输出更新后的节点表示;步骤五、全连接分类:训练Transformer网络,将更新后的节点表示送入分类层,通过预测概率获取设备类别。2.根据权利要求1所述的用于IP定位的网络实体识别方法,其特征在于,所述特征提取为:对所获取的流量数据做分析,对各个属性特征进行分析,选取属于该特征类型的前20%类型作为属性特征;所述属性特征包括:IP地址
‑‑‑
IP、IPv6后缀
‑‑‑
IP
s
、IPv6地址嵌入类型
‑‑‑
IP
a
、端口
‑‑‑
Port、网络层协议
‑‑‑
NP、传输层协议
‑‑‑
TP、应用层协议
‑‑‑
AP、TCP窗口大小
‑‑‑
WS、TTL值
‑‑‑
TTL、漏洞类型
‑‑‑
CVE、ICMPv6速率
‑‑‑
IR、操作系统
‑‑‑
OS;采用GWS
‑
Geo的方式对匿名节点进行同等替换处理,减少网络拓扑结构中匿名节点的数量;对于仍无法匿名处理的节点,采用独热编码处理,将匿名节点的所有特征设置为其他,其特征向量为全0,标签设置为其他设备。3.根据权利要求2所述的用于IP定位的网络实体识别方法,其特征在于,根据路径信息以及路径的连接关系,将路径拆解为两两连接,采用DGLGraph函数构建网络拓扑图;所述网络拓扑图为图G={V,X,E},节点V=v1,v2,
…
,v
i
,节点的属性特征X=IP,IP
s
,IP
a
,Port,NP,TP,AP,CVE,IR,OS,边集合e
ij
代表节点v
i
与节点v
j
之间的边,en表示矩阵大小;与节点v
i
相邻的邻居节点集合N(v
i
)={u1,u2,
…
,u
n
,u
i
&v
i
∈V}包括自身节点;图G的临界矩阵A=[a
ij
]为对称矩阵,如果节点v
i
与节点v
j
之间有共同边,元素a
ij
=1,否则元素a
ij
=0。4.根据权利要求1
‑
3中任意一项所述的用于IP定位的网络实体识别方法,其特征在于,所述社区聚类方法为社区划分算法Leiden;所述社区划分算法Leiden计算社区之间的节点和边的关系,在迭代应用时,收敛到一个分区,在该分区中所有社区的所有子集都被局部最优分配,从而产生保证连接的社区;选取模块度来评价社区内节点分组质量好坏,模块度为:其中,mc表示总边数,c表示社区,e
c
表示社区c内部边的数量,D
c
表示社区c节点的度和,γ是分辨率参数:社区内的密度至少为分辨率参数γ,而社区间的密度低于分辨率参数γ。5.根据权利要求4所述的用于IP定位的网络实体识别方法,其特征在于,所述社区聚类方法的聚类步骤为:1)节点的局部移动,每个节点视为一个单独的社区,将单个节点从一个社区移动到另一个社区提高质量函数,以发现划分情况;2)改善划分结果,对节点进行改善,将节点与随机选择的社区合并,增加质量函数;3)基于改善后划分情况凝聚网络,基于未改善时划分情况初始化凝聚后网络;重复以上步骤,直到无法进一步完善。
6.根据权利要求3或5所述的用于IP定位的网络实体识别方法,其特征在于,所述Transformer计算的实现方法为:节点特征向量X=x1,x2,
…
,x
i
∈R
n
×
d
表示Transformer隐藏层的输入,其中,d为隐藏层的维度,x
i
∈R1×
d
【专利技术属性】
技术研发人员:马照瑞,张世城,栗娜,胡新浩,李天傲,王宏建,冯浩,周诗洁,张帅威,翟亚琦,牛鑫,宋仕豪,王宏,张海涛,
申请(专利权)人:郑州轻工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。