【技术实现步骤摘要】
一种基于图神经网络的街道级IPv6地理定位方法
[0001]本专利技术涉及IPv6地理定位的
,尤其涉及一种基于图神经网络的街道级IPv6地理定位方法。
技术介绍
[0002]IP地理位置是一种允许用户基于设备的IP地址的特征(如网络测量或可查询信息)推断设备地理位置的技术,也称为网络实体地理位置。IP地理位置有许多应用,如网络安全,可用于验证和检测用户登录信息,检测服务器入侵行为,追踪非法信息传输的来源,追踪网络攻击的来源,限制网络犯罪,并封锁网络的某些区域等。在商业营销方面,IP地理位置可以用于基于用户的地理位置和人口密度来推送目标广告,或者定向自动网页翻译或其他商业领域提供地理位置信息。
[0003]根据定位粒度和在非协作条件下,现有IP地理定位算法可以分为两类:城市级和街道级。城市级算法,如Constraint
‑
based Geolocation(CBG)、Learning
‑
based Geolocation(LBG)和Ranking Nodes
‑
based Geolocation(RNBG)算法的中值误差距离在100km以内。而街道级算法,例如Street
‑
Level Geolocation(SLG)、Identification Routers and Local Delay
‑
based Geolocation(IRLD)、Geolocation of covert communication ...
【技术保护点】
【技术特征摘要】
1.一种基于图神经网络的街道级IPv6地理定位方法,其特征在于,其步骤如下:步骤一,预处理:对所获得的IP地址进行匿名处理去除匿名节点,并将地标信息中的经度和纬度转换为区域编号;利用图神经网络将处理后的节点的信息转化为属性特征图;步骤二,预训练:通过基于学习的方式将属性特征图的边的特征信息转换为边的权重;步骤三,将步骤一得到的包括IPv6地址和中间路由节点的节点的特征信息馈送到改进的GraphSAGE模型中,根据边的权重进行剪枝,通过卷积学习相邻节点的信息,聚合和更新节点信息,并在节点表示后输出节点属性更新矩阵;步骤四:将节点属性更新矩阵放入层级分类模块中进行分类,输出目标的区域编号,即目标的地理位置。2.根据权利要求1所述的基于图神经网络的街道级IPv6地理定位方法,其特征在于,所述匿名处理通过Traceroute处理探测器到目标IP地址获取路径信息,图神经网络对节点和拓扑结构进行信息编码,得到属性特征图;所述节点的信息包括IP地址V、与相邻节点相连接的边的时延D、域名查询协议信息WH、中间路由节点mid_route和主机名Hostname。3.根据权利要求2所述的基于图神经网络的街道级IPv6地理定位方法,其特征在于,所述图神经网络对节点和拓扑结构进行信息编码的方法为:计算机网络的拓扑关系用图神经网络表示为属性特征图G=V,E,VX,EX,其中,V=v1,v2,,v
i
}是节点集合,v
i
代表计算机网络中的第i个网络节点;E={e
ij
}是边集合,e
ij
代表节点v
i
与节点v
j
之间的边;N(v
i
)={u1,u2,
…
,u
n
,u
n
&v
i
∈V,u
n
表示与节点v
i
相邻的邻居节点集合;VX代表每个节点上的特征;EX代表边上的特征;A=a
ij
]代表临界矩阵表,如果节点v
i
与节点v
j
之间有连接,元素a
ij
=1,否则a
ij
=0,临界矩阵表A为对称矩阵。4.根据权利要求3所述的基于图神经网络的街道级IPv6地理定位方法,其特征在于,对于多次无法显示节点的数据,匿名处理的方法为:(1)若两条路径的父节点和子节点分别相同,匿名路由或多个中间路由与最短路径的路由A等同为别名路由或负载路由,将匿名路由和中间多个路由的IP替换为最短路径的路由A的IP;(2)在同一区域使用探测器I和探测器II相互测量,两条路径中的父节点I和子节点II不相同,子节点I和父节点II也不相同,但是使用别名检测算法确定父节点I和子节点II、子节点I和父节点II均互为别名路由器;若其父节点和子节点分别相同,匿名节点和路由为别名路由或负载路由,两条路径只选其一;将地标信息转换为区域编号的方法为:使用全球统一经纬度的方式划分区域,将实验收集的候选地标按照经纬度区域划分,首先对于一个实验区域采用二分法划分,再对二分法划分后的区域继续二分法划分,将地标的经纬度转为每个区域对应的区域编号。5.根据权利要求3或4所述的基于图神经网络的街道级IPv6地理定位方法,其特征在于,所述基于学习的方式的实现方法为:所述边的特征EX为边上两个IP设备之间的时延D、两个IP的相似度P、域名查询协议相似度Q和主机名相似度HN,则EX={D,P,Q,HN},节点v
i
与节点v
j
之间的时延d
ij
组成的集合时延D为原始数据;边上两个IP的相似度P中的元素为:
其中,s
ij
表示边e
ij
的两个IP连续相同的位数,h表示IP的总位数,p
ij
表示两个IP相似的比例,且p
ij
∈[0,1];域名查询协议相似度Q中的元素为:其中,z
ij
表示边e
ij
相连的两个IP的域名查询协议信息相同的数目,g表示域名查询协议信息的总条数,q
ij
表示边上两个IP的域名查询协议相似度,且q
ij
∈[0,1];主机名相似度HN中的元素为:其中,m
ij
表示边e
ij
相连的两个IP的最大主机名字符串,n
ij
表示相连的两个IP连续相同的字符串,hn
ij
表示边e
ij
的主机名相似度,且hn
ij
∈[0,1];构建线性回归模型:f(EX
ij
)=(w
t
x+bias1);其中,w0,w1,w2,w3分别对应元素d
ij
,p
ij
,q
ij
,hn
ij
的权重,w
t
={w0,w1,w2,w3}表示权重矩阵,x={d
ij
,p
ij
,q
ij
,hn
i...
【专利技术属性】
技术研发人员:马照瑞,张世城,栗娜,胡新浩,王宏建,李天傲,董麒麟,冯浩,殷毅,周诗洁,闫震,朱付保,马培凯,
申请(专利权)人:郑州轻工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。