一种基于图神经网络的街道级IPv6地理定位方法技术

技术编号:37269121 阅读:25 留言:0更新日期:2023-04-20 23:39
本发明专利技术提出了一种基于图神经网络的街道级IPv6地理定位方法,用以解决当前IPv6地理定位方法存在定位细粒度较低的技术问题。本发明专利技术的步骤为:对所获得的IP地址进行匿名处理,并将地标的经纬度信息转换为区域编号;利用图神经网络将处理后的节点信息转化为属性特征图;通过基于学习的方式将属性特征图的边的特征信息转换为边的权重;将节点的特征信息馈送到改进的GraphSAGE模型中,根据边的权重进行剪枝,通过卷积学习相邻节点的信息,并在节点表示后输出节点信息;结合区域编号将经过改进的GraphSAGE模型的节点属性更新矩阵放入层级分类模块中进行分类,输出目标地理定位。本发明专利技术在中值误差、平均误差和最大误差方面优于当前的IPv6地理定位算法。的IPv6地理定位算法。的IPv6地理定位算法。

【技术实现步骤摘要】
一种基于图神经网络的街道级IPv6地理定位方法


[0001]本专利技术涉及IPv6地理定位的
,尤其涉及一种基于图神经网络的街道级IPv6地理定位方法。

技术介绍

[0002]IP地理位置是一种允许用户基于设备的IP地址的特征(如网络测量或可查询信息)推断设备地理位置的技术,也称为网络实体地理位置。IP地理位置有许多应用,如网络安全,可用于验证和检测用户登录信息,检测服务器入侵行为,追踪非法信息传输的来源,追踪网络攻击的来源,限制网络犯罪,并封锁网络的某些区域等。在商业营销方面,IP地理位置可以用于基于用户的地理位置和人口密度来推送目标广告,或者定向自动网页翻译或其他商业领域提供地理位置信息。
[0003]根据定位粒度和在非协作条件下,现有IP地理定位算法可以分为两类:城市级和街道级。城市级算法,如Constraint

based Geolocation(CBG)、Learning

based Geolocation(LBG)和Ranking Nodes

based Geolocation(RNBG)算法的中值误差距离在100km以内。而街道级算法,例如Street

Level Geolocation(SLG)、Identification Routers and Local Delay

based Geolocation(IRLD)、Geolocation of covert communication entity on the Internet for post

steganalysis(MLP

Geo)和Exploiting Leaked Identifiers in IPv6 for Street

Level Geolocation(IPvSeeYou)等人的中值误差距离在10km以内。其中,CBG、LBG和RNBG算法适用于IPv4,而Latency Constraints and Neighbor Sequences

based Geolocation(LCNS)适用于IPv6,但地理定位准确率较低。大多数现有的IPv6地理定位算法仍处于城市级别。
[0004]随着IPv4地址的耗尽,全球IPv6部署已进入加速阶段。然而,IPv4地址和IPv6地址之间存在一些差异,使得现有的IPv4地理定位方法(如CBG、LBG、RNBG等算法)不直接适用于IPv6网络,或者由于网络路由的不完善和IPv6地址的稀疏性而产生不满意的结果,并且现有的IPv6 CBG和LCNS算法不具有高的地理定位精度,并且具有较大的中值误差距离。这些差异包括:1)IPv6地址空间巨大,无法进行遍历探测;2)IPv6地址稀疏,这导致了使用地址的稀缺性和测量的巨大时间成本;3)在网络安全防御的背景下,网络空间测绘和网络空间反测绘(CASM)技术导致了大量匿名服务器;4)IPv6地址的存储成本增加,IPv6网络的连通性差导致大量具有环路和高延迟的路由。此外,由于持续有动态新增的激活IP,网络拓扑结构变化较快。
[0005]当前基于学习的方法,如机器学习和深度学习,已经在网络安全领域得到了广泛应用,包括图神经网络。本专利技术将图神经网络与计算机网络有机结合,以解决上述的局限性。

技术实现思路

[0006]针对当前的IPv6地理定位方法存在定位细粒度较低的技术问题,本专利技术提出一种
基于图神经网络的街道级IPv6地理定位方法,通过基于学习的方式过滤服务于一个区域的所有相关路由器,然后使用分层分类方法通过缩小区域来逐渐收敛地理位置粒度,提高了IPv6中的地理定位细粒度,并且地理定位模型接近街道级地理位置的程度。
[0007]为了达到上述目的,本专利技术的技术方案是这样实现的:一种基于图神经网络的街道级IPv6地理定位方法,其步骤如下:
[0008]步骤一,预处理:对所获得的IP地址进行匿名处理去除匿名节点,并将地标信息中的经度和纬度转换为区域编号;利用图神经网络将处理后的节点的信息转化为属性特征图;
[0009]步骤二,预训练:通过基于学习的方式将属性特征图的边的特征信息转换为边的权重;
[0010]步骤三,将步骤一得到的包括IPv6地址和中间路由节点的节点的特征信息馈送到改进的GraphSAGE模型中,根据边的权重进行剪枝,通过卷积学习相邻节点的信息,聚合和更新节点信息,并在节点表示后输出节点属性更新矩阵;
[0011]步骤四:将节点属性更新矩阵放入层级分类模块中进行分类,输出目标的区域编号,即目标的地理位置。
[0012]优选地,所述匿名处理通过Traceroute处理探测器到目标IP地址获取路径信息,图神经网络对节点和拓扑结构进行信息编码,得到属性特征图;所述节点的信息包括IP地址V、与相邻节点相连接的边的时延D、域名查询协议信息WH、中间路由节点mid_route和主机名Hostname。
[0013]优选地,所述图神经网络对节点和拓扑结构进行信息编码的方法为:计算机网络的拓扑关系用图神经网络表示为属性特征图G=(V,E,VX,EX),其中,V={v1,v2,

,v
i
}是节点集合,v
i
代表计算机网络中的第i个网络节点;E={e
ij
}是边集合,e
ij
代表节点v
i
与节点v
j
之间的边;N(v
i
)={u1,u2,...,u
n
,u
n
&v
i
∈V},u
n
表示与节点v
i
相邻的邻居节点集合;VX代表每个节点上的特征;EX代表边上的特征;A=[a
ij
]代表临界矩阵表,如果节点v
i
与节点v
j
之间有连接,元素a
ij
=1,否则a
ij
=0,临界矩阵表A为对称矩阵。
[0014]优选地,对于多次无法显示节点的数据,匿名处理的方法为:
[0015](1)若两条路径的父节点和子节点分别相同,匿名路由或多个中间路由与最短路径的路由A等同为别名路由或负载路由,将匿名路由和中间多个路由的IP替换为最短路径的路由A的IP;
[0016](2)在同一区域使用探测器I和探测器II相互测量,两条路径中的父节点I和子节点II不相同,子节点I和父节点II也不相同,但是使用别名检测算法确定父节点I和子节点II、子节点I和父节点II均互为别名路由器;若其父节点和子节点分别相同,匿名节点和路由为别名路由或负载路由,两条路径只选其一;
[0017]将地标信息转换为区域编号的方法为:使用全球统一经纬度的方式划分区域,将实验收集的候选地标按照经纬度区域划分,首先对于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图神经网络的街道级IPv6地理定位方法,其特征在于,其步骤如下:步骤一,预处理:对所获得的IP地址进行匿名处理去除匿名节点,并将地标信息中的经度和纬度转换为区域编号;利用图神经网络将处理后的节点的信息转化为属性特征图;步骤二,预训练:通过基于学习的方式将属性特征图的边的特征信息转换为边的权重;步骤三,将步骤一得到的包括IPv6地址和中间路由节点的节点的特征信息馈送到改进的GraphSAGE模型中,根据边的权重进行剪枝,通过卷积学习相邻节点的信息,聚合和更新节点信息,并在节点表示后输出节点属性更新矩阵;步骤四:将节点属性更新矩阵放入层级分类模块中进行分类,输出目标的区域编号,即目标的地理位置。2.根据权利要求1所述的基于图神经网络的街道级IPv6地理定位方法,其特征在于,所述匿名处理通过Traceroute处理探测器到目标IP地址获取路径信息,图神经网络对节点和拓扑结构进行信息编码,得到属性特征图;所述节点的信息包括IP地址V、与相邻节点相连接的边的时延D、域名查询协议信息WH、中间路由节点mid_route和主机名Hostname。3.根据权利要求2所述的基于图神经网络的街道级IPv6地理定位方法,其特征在于,所述图神经网络对节点和拓扑结构进行信息编码的方法为:计算机网络的拓扑关系用图神经网络表示为属性特征图G=V,E,VX,EX,其中,V=v1,v2,,v
i
}是节点集合,v
i
代表计算机网络中的第i个网络节点;E={e
ij
}是边集合,e
ij
代表节点v
i
与节点v
j
之间的边;N(v
i
)={u1,u2,

,u
n
,u
n
&v
i
∈V,u
n
表示与节点v
i
相邻的邻居节点集合;VX代表每个节点上的特征;EX代表边上的特征;A=a
ij
]代表临界矩阵表,如果节点v
i
与节点v
j
之间有连接,元素a
ij
=1,否则a
ij
=0,临界矩阵表A为对称矩阵。4.根据权利要求3所述的基于图神经网络的街道级IPv6地理定位方法,其特征在于,对于多次无法显示节点的数据,匿名处理的方法为:(1)若两条路径的父节点和子节点分别相同,匿名路由或多个中间路由与最短路径的路由A等同为别名路由或负载路由,将匿名路由和中间多个路由的IP替换为最短路径的路由A的IP;(2)在同一区域使用探测器I和探测器II相互测量,两条路径中的父节点I和子节点II不相同,子节点I和父节点II也不相同,但是使用别名检测算法确定父节点I和子节点II、子节点I和父节点II均互为别名路由器;若其父节点和子节点分别相同,匿名节点和路由为别名路由或负载路由,两条路径只选其一;将地标信息转换为区域编号的方法为:使用全球统一经纬度的方式划分区域,将实验收集的候选地标按照经纬度区域划分,首先对于一个实验区域采用二分法划分,再对二分法划分后的区域继续二分法划分,将地标的经纬度转为每个区域对应的区域编号。5.根据权利要求3或4所述的基于图神经网络的街道级IPv6地理定位方法,其特征在于,所述基于学习的方式的实现方法为:所述边的特征EX为边上两个IP设备之间的时延D、两个IP的相似度P、域名查询协议相似度Q和主机名相似度HN,则EX={D,P,Q,HN},节点v
i
与节点v
j
之间的时延d
ij
组成的集合时延D为原始数据;边上两个IP的相似度P中的元素为:
其中,s
ij
表示边e
ij
的两个IP连续相同的位数,h表示IP的总位数,p
ij
表示两个IP相似的比例,且p
ij
∈[0,1];域名查询协议相似度Q中的元素为:其中,z
ij
表示边e
ij
相连的两个IP的域名查询协议信息相同的数目,g表示域名查询协议信息的总条数,q
ij
表示边上两个IP的域名查询协议相似度,且q
ij
∈[0,1];主机名相似度HN中的元素为:其中,m
ij
表示边e
ij
相连的两个IP的最大主机名字符串,n
ij
表示相连的两个IP连续相同的字符串,hn
ij
表示边e
ij
的主机名相似度,且hn
ij
∈[0,1];构建线性回归模型:f(EX
ij
)=(w
t
x+bias1);其中,w0,w1,w2,w3分别对应元素d
ij
,p
ij
,q
ij
,hn
ij
的权重,w
t
={w0,w1,w2,w3}表示权重矩阵,x={d
ij
,p
ij
,q
ij
,hn
i...

【专利技术属性】
技术研发人员:马照瑞张世城栗娜胡新浩王宏建李天傲董麒麟冯浩殷毅周诗洁闫震朱付保马培凯
申请(专利权)人:郑州轻工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1