一种IP地址数据库生成方法和装置制造方法及图纸

技术编号:17366187 阅读:45 留言:0更新日期:2018-02-28 18:08
本发明专利技术提供了一种IP地址数据库生成方法和装置。涉及计算机网络领域;解决了现有IP地址数据库精确度差、效率低下的问题。该方法包括:将抓取的至少一个原始IP地址数据库转化为标准化结构的初级标准库;根据当前业务类型,对所述初级标准库的精度进行修正,生成定制发布库。本发明专利技术提供的技术方案适用于IP地址定位,实现了标准化、高精度、可更新的IP地址数据库。

A method and device for generating IP address database

The invention provides a method and device for generating IP address database. It relates to the field of computer network, and solves the problem of poor accuracy and low efficiency of the existing IP address database. The method comprises the following steps: transforming at least one original IP address database grabbed to a primary standard library of standardized structure, and modifying the accuracy of the primary standard library according to the current business type, so as to generate customized publishing repository. The technical scheme provided by the invention is suitable for the location of IP address, and realizes the standardized, high precision and renewable IP address database.

【技术实现步骤摘要】
一种IP地址数据库生成方法和装置
本专利技术涉及计算机网络领域,尤其涉及一种IP地址数据库生成方法和装置。
技术介绍
随着互联网的发展,IP库在智能调度、数据分析等方面的地位越来越重要,因而整理获取IP地址定位精准的IP库成为了价值产出非常高的工作。现有IP库版本繁多,如IPIP、纯真、IP138、IP2location、maxmind等,每个IP库对于相同IP段都有一套独立的描述体系,具有不同的定位特性和精准度(例如省级地域精准、教育网精准、区县级行政区精准)。不同的IP库之间无论是涵盖的IP段范围还是对具体IP的描述均存在差异。在业务系统需要使用IP库时,如采用单一IP库,则很难确定该IP库与当前业务需求是否匹配,且仅单一IP库导致信息来源亦是单一,精确度较差;而采用多IP库对比使用的策略时,又需要面对多个IP库之间的差异,在IP库之间频繁切换对比,效率低下。
技术实现思路
本专利技术旨在解决上面描述的问题。根据本专利技术的第一方面,提供了一种IP地址数据库生成方法,包括:将抓取的至少一个原始IP地址数据库转化为标准化结构的初级标准库;根据当前业务类型,对所述初级标准库的精度进行修正本文档来自技高网...
一种IP地址数据库生成方法和装置

【技术保护点】
一种IP地址数据库生成方法,其特征在于,包括:将抓取的至少一个原始IP地址数据库转化为标准化结构的初级标准库;根据当前业务类型,对所述初级标准库的精度进行修正,生成定制发布库。

【技术特征摘要】
1.一种IP地址数据库生成方法,其特征在于,包括:将抓取的至少一个原始IP地址数据库转化为标准化结构的初级标准库;根据当前业务类型,对所述初级标准库的精度进行修正,生成定制发布库。2.根据权利要求1所述的IP地址数据库生成方法,其特征在于,所述将抓取的至少一个原始IP地址数据库转化为标准化结构的初级标准库的步骤包括:匹配所述原始IP地址数据库的定位描述字段和预设的IP库字典的原始库描述字段,将所述原始IP地址库转移为中间库,所述中间库的地址描述至少包含任一或任意多个如下字段:起始IP,终止IP,国家,ISP,省,市,区县,街道,经纬度,附加字段,原始库名称,其中,“起始IP”与“终止IP”分别为所述中间库对应的原始IP地址数据库覆盖IP地址段的起始IP地址与终止IP地址,“原始库名称”为所述中间库对应的原始IP地址数据库的名称;为所述中间库的地址描述中涉及定位描述的各个字段分配权重,得到初级标准库。3.根据权利要求2所述的IP地址数据库生成方法,其特征在于,该方法还包括:在所述涉及定位描述的字段中,地理范围较小的字段权重大于地址范围较大的字段权重时,重置所述地址范围较小的字段的权重为小于等于所述地址范围较大的字段的权重。4.根据权利要求2所述的IP地址数据库生成方法,其特征在于,所述根据当前业务类型,对所述初级标准库的精度进行修正,生成定制发布库的步骤包括:从所述初级标准库中提取符合预设条件的标准字段描述,形成第一发布库;根据当前业务类型,对所述初级标准库进行二次筛选,得到修正数据;将所述修正数据与所述第一发布库合并,得到所述定制发布库。5.根据权利要求4所述的IP地址数据库生成方法,其特征在于,所述预置条件包含提取精度和/或提取权重,指示对提取精度指向的字段的权重达到所述提取权重的IP地址段进行提取,所述从所述初级标准库中提取符合预设条件的标准字段描述,形成第一发布库的步骤包括:将全IP段划分为N个最小IP段,所述最小IP段在抓取的任一原始IP地址数据库对应的初级标准库中都能匹配到相应的定位描述信息;提取所述最小IP段在各个原始IP地址数据库对应的初级标准库中的定位描述及权重信息;对所述最小IP段在各个原始IP地址数据库中的定位描述进行权重合并,并将相同字段对应的权重叠加,得到所述字段的合并权重,由所述字段与所述合并权重构成所述最小IP段的第一定位描述;根据所述预设条件,提取所述第一定位描述中提取精度指向的字段的合并权重达到所述提取权重的最小IP段;使用提取得到的最小IP段及其相应的第一定位描述,形成第一发布库。6.根据权利要求5所述的IP地址数据库生成方法,其特征在于,根据所述预设条件,提取所述第一定位描述中提取精度指向的字段的合并权重达到所述提取权重的最小IP段的步骤还包括:对所述最小IP段的第一定位描述进行逻辑校验,对比标准区域列表,在所述第一定位描述中存在与所述标准区域列表不匹配的字段时,将相应的字段清空。7.根据权利要求5所述的IP地址数据库生成方法,其特征在于,所述根据当前业务类型,对所述初级标准库进行二次筛选,得到修正数据的步骤包括:根据当前业务类型,设置所述第一定位描述中提取精度指向的字段的人工智能AI处理权重,对于同一字段来说,所述AI处理权重小于等于所述提取权重;对第一定位描述中提取精度指向的字段的权重大于等于所述AI处理权重且小于所述提取权重的最小IP段,进行路由跟踪处理,得到本最小IP段的上一跳路由IP地址;在所述上一跳路由IP地址落入的最小IP段的第一定位描述中提取精度指向的全部字段的权重均大于相应的提取权重时,提取所述上一跳路由IP地址落入的最小IP段的第一定位描述替换本最小IP段的第一定位描述,形成修正数据。8.根据权利要求7所述的IP地址数据库生成方法,其特征在于,根据当前业务类型,设置所述第一定位描述中提取精度指向的字段的AI处理权重具体为:在工作于AI关闭状态时,设置所述AI处理权重等于所述提取权重;在工作于AI部分开启状态时,设置所述AI处理权重小于所述提取权重,且大于0;在工作于AI开启状态时,设置所述AI处理权重为0。9.根据权利要求7所述的IP地址数据库生成方法,其特征在于,所述根据当前业务类型,对所述初级标准库进行二次筛选,得到修正数据的步骤还包括:对于第一定位描述中存在包含两个以上...

【专利技术属性】
技术研发人员:符立佳苗辉
申请(专利权)人:贵州白山云科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1