一种IPv6地址搜索方法、系统、介质及设备技术方案

技术编号:39005422 阅读:16 留言:0更新日期:2023-10-07 10:36
本发明专利技术公开一种IPv6地址搜索方法、系统、介质及设备,其中,所述系统包括数据采集单元、数据处理单元、建模单元、Apriori算法处理单元和遍历单元,数据处理单元包括一级分类模块、IPv6地址生成模块、IPv6地址活跃判断模块和二级分类模块,数据采集单元与与一级分类模块通信连接,一级分类模块与IPv6地址生成模块通信连接,IPv6地址生成模块与IPv6地址活跃判断模块通信连接,IPv6地址活跃判断模块与二级分类模块通信连接,二级分类模块与建模单元通信连接,建模单元与Apriori算法处理单元通信连接,Apriori算法处理单元与遍历单元通信连接。本发明专利技术解决了海量IPv6地址的探测问题,提高了IPv6地址的搜索的命中率和分析效率。IPv6地址的搜索的命中率和分析效率。IPv6地址的搜索的命中率和分析效率。

【技术实现步骤摘要】
一种IPv6地址搜索方法、系统、介质及设备


[0001]本专利技术涉及计算机应用
,具体地说是一种IPv6地址搜索方法、系统、介质及设备。

技术介绍

[0002]随着互联网用户的不断增加,传统的IPV4地址数量已经无法满足快速增长的互联网发展需求。IPv4协议规定IP地址长度为32位,也就是说IPv4地址只有2的32次方个。全球所有43亿个IPv4地址已分配完毕,这意味着没有更多的IPv4地址可以分配给ISP和其他大型网络基础设施提供商。IPv6的地址长度为128位,其地址空间为2的128次方,可以有效解决当前地址空间枯竭困境,并满足未来物联网、大数据等新型网络技术对网络地址的爆炸式需求。IPV6地址未来将逐渐淘汰IPV4,因此,对于海量IPV6地址的发现与探索变得十分重要。
[0003]目前有一些研究者提出基于种子地址的活跃IPv6地址探测方法,即通过对IPV6种子地址结构规律的学习来生成待探测的可能存活的IPv6新地址。种子地址指的是研究者收集的长期或短期存活的IPv6地址。比如根据种子地址集合在每个比特位的取值情况建立二叉搜索树,按照一定优先级顺序遍历每个比特位的取值,实现地海量IPv6地址的探索。
[0004]以二叉搜索树的方法发现IPV6地址存在这很多差问题。在生成的地址分布不平衡问题,即生成地址大部分集中在某些地址数量非常多的前缀或者某些特别活跃的地 址空间区域。相关算法几乎都是依靠IPV6本身的128比特信息对种子地址进行划分或分类,而忽略了地址关联的多个维度信息。 其提出的地址空间建模的方法在建模空间大小的选择上存在缺陷,要么过分依赖收集的种子地址导致地址建模空间变小从而引发样本偏差问题,要么建模空间过大导致待生成的地址范围较大从而大幅降低命中率。

技术实现思路

[0005]为此,本专利技术所要解决的技术问题在于提供一种IPv6地址搜索方法、系统、介质及设备,解决了海量IPv6地址的探测问题,提高了IPv6地址的搜索的命中率和分析效率。
[0006]为解决上述技术问题,本专利技术提供如下技术方案:一种IPv6地址搜索方法,包括如下步骤:S1)根据种子地址的两个维度信息对种子地址进行分类,得到待搜索地址集合,其中,所述两个维度信息分别为自治号+边界网关协议和地址接口标识符号IID;S2)为经步骤S1)分类后的某一类待搜索地址集合设置探索的空间范围,将空间范围定义为SR并通过下式进行计算得到:其中,为待搜索地址集合中每个半字节去重之后其取值的乘积和;为待搜索地址集合中每个半字节各取值的个数乘积和;
为待搜索地址集合中第个半字节的熵;为待搜索地址集合中第个半字节的极差;为待搜索地址集合中第个半字节的取值种数;为待搜索地址集合中第个半字节去重后的取值;S3)利用Apriori算法求出步骤S2)中空间范围SR内的IPv6地址的极大、熵、取值种数的比较结果和可选数据的集合;S4)循环遍历待搜索地址集合中的种子地址,计算统计量的比较结果,进而得到该种子地址的可选值内容。
[0007]上述方法,在步骤S1)中对种子地址进行分类通过如下步骤实现:S1

1)利用自治系统的ASN或IPv6地址的BGP前缀对种子地址进行初次分类,得到初次分类地址集合;S1

2)依据步骤S1

1)中得到的每个初次分类地址集合生成一个与该初次分类地址集合相对应的新IPv6地址;S1

3)利用基于种子地址的IPv6活跃地址发现算法判断步骤S1

2)中生成的新IPv6地址是否为活跃地址;S1

4)利用地址接口标识符IID对步骤S1

3)中被判断为活跃地址的新IPv6地址进行二次分类,得到待搜索地址集合。
[0008]上述方法,在步骤S1

4)中,利用地址接口标识符号IID的Log_A值对被判断为活跃地址的新IPv6地址进行二次分类;其中,Log_A通过下式计算得到:其中,A通过下式计算得到:式中,n为IPv6地址最后16个半字节IID部分取值最多值的个数;为IPv6地址第个半字节的取值,取值范围为16进制[0,f]。
[0009]上述方法,在步骤S2)中,计算某一类待搜索地址集合中每个IPv6地址的每个半字节位置在该待搜索地址集合中的三个统计量并将这三个统计量与该待搜索地址集合的阈值进行比较,得出与阈值的一组比较结果,然后根据该比较结果和对应的地址可选数组,设定要探索的IID中每个半字节的具体字符,其中,三个统计量分别为极差、Shannon熵和取值种类数,第个半字节的Shannon熵定义为:
式中,为待搜索地址集合在第个半字节取值为的概率。
[0010]上述方法,待搜索地址集合的阈值通过如下步骤获得:S2

11)通过SR计算公式得出某一类待搜索地址集合Log_A中的空间变化范围,且通过SR计算公式得出某一类待搜索地址集合Log_A中的空间变化范围的操作方式依次求出所有待搜索地址集合Log_A组中最大空间探索变化范围;S2

12)通过下式求出每个待搜索地址集合的标准差平均值:式中,为所有待搜索地址集合的SR的算数平均值;S2

13)依据步骤S2

12)中计算得到的BalanceSR值,计算SR与BalanceSR差距最小的待搜索地址集合中种子地址的16个半字节的三个统计量,并将计算得到的三个统计量作为所有待搜索地址集合的三个统计量的阈值;S2

14)将所有待搜索地址集合中的种子地址的IID的每个半字节与步骤S2

13)中得到的阈值进行比较,确定出每个半字节应该设定的IP取值。
[0011]一种利用上述IPv6地址搜索方法进行IPv6地址搜索的系统,包括:数据采集单元,用于通过自动采集或者人工载入的方式采集IPv6地址;数据处理单元,用于对数据采集单元采集到的IPv6地址进行分类;建模单元,用于对经数据处理单元分类后得到的某一类待搜索地址集合构建空间范围模型;Apriori算法处理单元,用于求出处于建模单元构建的空间范围模型所限定的空间范围内的IPv6地址的极大、熵以及取值种数的比较结果和可选数据的集合;遍历单元,用于循环遍历Apriori算法处理单元求出的极大、熵以及取值种数的比较结果和可选数据集合;数据采集单元与数据处理单元通信连接,数据处理单元与建模单元通信连接,建模单元与Apriori算法处理单元通信连接,Apriori算法处理单元与遍历单元通信连接。
[0012]上述系统,数据处理单元包括:一级分类模块,用于利用自治系统的ASN或IPv6地址的BGP前缀对种子地址进行初次分类;IPv6地址生成模块,用于根据一级分类模块的处理结果生成新IPv6地址;IPv6地址活跃判断模块,用于判断IPv6地址生成模块生成的新IPv6地址是否为活跃地址;二级分类模块,用于利用地址接口标识符IID对被判断为活跃地址的新IP本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种IPv6地址搜索方法,其特征在于,包括如下步骤:S1)根据种子地址的两个维度信息对种子地址进行分类,得到待搜索地址集合,其中,所述两个维度信息分别为自治号+边界网关协议和地址接口标识符号IID;S2)为经步骤S1)分类后的某一类待搜索地址集合设置探索的空间范围,将空间范围定义为SR并通过下式进行计算得到:其中,为待搜索地址集合中每个半字节去重之后其取值的乘积和;为待搜索地址集合中每个半字节各取值的个数乘积和;为待搜索地址集合中第个半字节的熵;为待搜索地址集合中第个半字节的极差;为待搜索地址集合中第个半字节的取值种数;为待搜索地址集合中第个半字节去重后的取值;S3)利用Apriori算法求出步骤S2)中空间范围SR内的IPv6地址的极差、熵、取值种数的比较结果和可选数据的集合;S4)循环遍历待搜索地址集合中的种子地址,计算统计量的比较结果,进而得到该种子地址的可选值内容。2.根据权利要求1所述的方法,其特征在于,在步骤S1)中对种子地址进行分类通过如下步骤实现:S1

1)利用自治系统的ASN或IPv6地址的BGP前缀对种子地址进行初次分类,得到初次分类地址集合;S1

2)依据步骤S1

1)中得到的每个初次分类地址集合生成一个与该初次分类地址集合相对应的新IPv6地址;S1

3)利用基于种子地址的IPv6活跃地址发现算法判断步骤S1

2)中生成的新IPv6地址是否为活跃地址;S1

4)利用地址接口标识符IID对步骤S1

3)中被判断为活跃地址的新IPv6地址进行二次分类,得到待搜索地址集合。3.根据权利要求2所述的方法,其特征在于,在步骤S1

4)中,利用地址接口标识符号IID的Log_A值对被判断为活跃地址的新IPv6地址进行二次分类;其中,Log_A通过下式计算得到:其中,A通过下式计算得到:
式中,n为IPv6地址最后16个半字节IID部分取值最多值的个数;为IPv6地址第个半字节的取值,取值范围为16进制[0,f]。4.根据权利要求1所述的方法,其特征在于,在步骤S2)中,计算某一类待搜索地址集合中每个IPv6地址的每个半字节位置在该待搜索地址集合中的三个统计量并将这三个统计量与该待搜索地址集合的阈值进行比较,得出与阈值的一组比较结果,然后根据该比较结果和对应的地址可选数组,设定要探索的IID中每个半字节的具体字符,其中,三个统计量分别为极差、Shannon熵和取值种类数,第个半字节的Shannon熵定义为:式中,为待搜索地址集合在第个半字节取值为的概率。5.根据权利要求4所述的方法,其特征在于,待搜索地址集合的阈值通过如下步骤获得:S2

11)...

【专利技术属性】
技术研发人员:曹放李玉诺张成冯健陈广义
申请(专利权)人:明阳点时科技沈阳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1