一种IP地址库的推断和填充方法技术

技术编号:11015342 阅读:130 留言:0更新日期:2015-02-06 00:36
本发明专利技术涉及一种IP地址库的推断和填充方法。该方法结合Traceroute探测得到的网络拓扑,对IP的地址归属数据进行纠正和填充,处理的基本单位是C网段(亦可以是更小的网段),并基于以下统计规律:对Traceroute探测中出现的连续三跳路由的IP,如果前一跳的IP和后一跳的IP具有相同的地理位置(同省或同市),则中间一跳的IP的地址也应该是相同的地理位置;ISP亦然;前后跳IP如果在具有相同地址的情况下也具有相同的ISP,则中间路由IP是同一地址的概率就更大。本发明专利技术能够利用自动化探测得到的数据来纠正和填充IP地址库中IP的地理位置和ISP信息,提高IP地址库的覆盖度,纠正IP地址库的数据。

【技术实现步骤摘要】
一种IP地址库的推断和填充方法
本专利技术属于网络
,具体涉及一种IP地址库的推断和填充方法,用于纠正 和填充Traceroute探测的IP地址库中IP的地理位置和ISP信息。
技术介绍
本专利技术方法基于Traceroute探测结果而提出。以基于UDP高端口实现的 Traceroute为例,其工作过程如下:Traceroute通过向目的主机发送一系列TTL(Time To Live,生存时间)值从1开始递增的的UDP报文,由于报文每经过一个路由器的处理,其TTL 值都会自减1,当中间路由器在收到报文时发现TTL超时,会向源主机回复ICMP超时报文 (ICMP time-exceeded message),这样源主机就得到了距离自己给定跳数之远的路由IP地 址。当报文到达目的主机时,目的主机回复的则是ICMP地址不可达报文(ICMP destination unreachable message),探测终止。这样我们就获得了从源地址到目的地址的路由转发路 径,从而利用这个路径去构建网络拓扑。 IP地址库通常提供了 IP地址段所在的地理位置、ISP (Internet Service Provider)等信息,通常从覆盖度、粒度和准确度上来进行评估。目前存在着很多免费和收 费的IP地址库,但通常都依靠网民反馈、调研等方法来收集和验证这些IP地址库的地址和 ISP归属信息,不够自动化。
技术实现思路
本专利技术针对上述问题,提出一种IP地址库的推断和填充方法,能够利用自动化探 测得到的数据来纠正和填充IP地址库中IP的地理位置和ISP信息,提高IP地址库的覆盖 度,纠正IP地址库的数据。 本专利技术的IP地址填充方法结合Traceroute探测得到的网络拓扑,对IP的地址归 属数据进行纠正和填充,处理的基本单位是C网段(亦可以是更小的网段)。该推断与填充 方法是基于以下统计规律:对Traceroute探测中出现的连续三跳路由的IP,如果前一跳的 IP和后一跳的IP具有相同的地理位置(同省或同市),则中间一跳的IP的地址也应该是 相同的地理位置。ISP亦然。前后跳IP如果在具有相同地址的情况下也具有相同的ISP, 则中间路由IP是同一地址的概率就更大。 具体来说,本专利技术采用的技术方案如下: -种IP地址库的推断和填充方法,如图1所示,其步骤包括: 1.对于一个IP,从Traceroute数据中找出满足其前后跳IP同地址的连续三跳 IP,并记录三个IP分别对应的C网段或者更小的网段,记做preNet,midNet和nextNet (其 中,preNet尹midNet且midNet尹nextNet);对于midNet来说,生成如下的各网段(C网段 或者更小的网段)对的元组列表: midNet: (preNet1; HextNet1),......, (preNetx, nextNetx); 2.使用给定的IP地址库和步骤1中提取出的元组列表,每一个元组根据下述验证 和填充的统计规则都会投票选出midNet的一个候选地址数据:如果元组中的前后跳具 有相同的地址,则针对中间一跳IP,则由该元组得到其候选地址数据,即与前后跳相同的地 址。 这样,midNet就得到了候选地址列表。如果该候选地址列表中的各候选地址相同, 则作为最终判定结果并结束;如果该候选地址列表中的各候选地址有不同,则继续下面的 步骤。 3.使用步骤2的结果,对midNet进行信息的判定,具体方法是: 1)对每一个候选地址ge〇i,记录是哪些元组投票选出的,这些元组的个数记为 Counti。然后对下列指标进行统计: ?前一跳子网与中间路由子网的链接preLink的出现次数preLinkCount ; ?后一跳子网与中间路由子网的链接nextLink的出现次数nextLinkCount ; ?前后跳子网ISP相同的元组数目same I SPCount ; ?前后跳子网各自的地址信息权威值(由相关专家人为设定)preGeoWeight和 nextGeoWeight。 2)计算每个候选地址的得分GeoScorei :本文档来自技高网...

【技术保护点】
一种IP地址库的推断和填充方法,其步骤包括:1)对于一个IP,从Traceroute数据中找出满足其前后跳IP同地址的连续三跳IP,并记录三个IP分别对应的C网段或者更小的网段,记做preNet,midNet和nextNet,其中,preNet≠midNet且midNet≠nextNet;对于midNet,生成如下的各网段对的元组列表:midNet:(preNet1,nextNet1),......,(preNetx,nextNetx);2)使用给定的IP地址库和步骤1)提取出的元组列表,每一个元组根据下述统计规则投票选出midNet的一个候选地址数据:如果元组中的前后跳具有相同的地址,则针对中间一跳IP,则由该元组得到其候选地址数据,即与前后跳相同的地址;从而得到midNet的候选地址列表;如果该候选地址列表中的各候选地址相同,则作为最终判定结果并结束;如果该候选地址列表中的各候选地址有不同,则继续下面的步骤;3)使用步骤2)的结果对midNet进行信息的判定,具体方法是:a)对每一个候选地址geoi,记录是哪些元组投票选出的,这些元组的个数记为counti,然后对下列指标进行统计:前一跳子网与中间路由子网的链接preLink的出现次数preLinkCount;后一跳子网与中间路由子网的链接nextLink的出现次数nextLinkCount;前后跳子网ISP相同的元组数目sameISPCount;前后跳子网各自的地址信息权威值preGeoWeight和nextGeoWeight;b)计算每个候选地址的得分GeoScorei:其中,α,β,γ是系数,f,g,是根据实际情况确定的函数定义;4)对于所有候选地址及其得分,按得分高低排列,将得到的候选地址列表作为midNet的地址最终判定结果,从而实现对原IP地址数据的纠正和填充。...

【技术特征摘要】
1. 一种IP地址库的推断和填充方法,其步骤包括: 1) 对于一个IP,从Traceroute数据中找出满足其前后跳IP同地址的连续三跳IP,并 记录三个IP分别对应的C网段或者更小的网段,记做preNet,midNet和nextNet,其中, preNet尹midNet且midNet尹nextNet ;对于midNet,生成如下的各网段对的元组列表: midNet: (PreNet1, IiextNet1),......, (preNetx, nextNetx); 2) 使用给定的IP地址库和步骤1)提取出的元组列表,每一个元组根据下述统计规则 投票选出midNet的一个候选地址数据:如果元组中的前后跳具有相同的地址,则针对中间 一跳IP,则由该元组得到其候选地址数据,即与前后跳相同的地址;从而得到midNet的候 选地址列表;如果该候选地址列表中的各候选地址相同,则作为最终判定结果并结束;如 果该候选地址列表中的各候选地址有不同,则继续下面的步骤; 3) 使用步骤2)的结果对midNet进行信息的判定,具体方法是: a) 对每一个候选地址ge〇i,记录是哪些元组投票选出的,这些元组的个数记为Counti, 然后对下列指标进行统计: ...

【专利技术属性】
技术研发人员:胡新静李晓东耿光刚陈勇
申请(专利权)人:中国科学院计算机网络信息中心
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1