一种网络地址的处理方法、计算设备及可读存储介质技术

技术编号:16506443 阅读:42 留言:0更新日期:2017-11-05 09:49
本发明专利技术公开了一种网络地址的处理方法,包括步骤:获取网络日志所包含的多个网络地址;分别获取每个网络地址所包含的网络路径,以得到多个网络路径;分别获取每个网络路径的目录结构;按照目录结构所包含的子目录的个数,将多个网络路径划分为至少一个集合;对于所划分的每个集合,根据该集合中的网络路径的目录结构生成一个树结构;自上而下地对该树结构中每一个非叶节点下的子节点进行合并;根据合并后的树结构获取至少一个新的网络路径;以及根据所获取的新的网络路径得到新的网络地址。本发明专利技术还公开了一种计算设备和计算机可读存储介质。

A network address processing method, computing device and readable storage medium

The invention discloses a processing method, a network address comprises the following steps: a plurality of network address access network log contains; obtain network path contains each network address, to obtain multiple network paths; directory structure were obtained for each network path; according to the number of directory structure contains subdirectories and a plurality of network path is divided into at least one set; for each partition, to generate a tree directory structure of the network path in the set; from the merger of each non leaf node in the tree structure under the sub node; according to the tree structure after the merger to acquire at least a new network path; and the new network path according to the new network address. The invention also discloses a computing device and a computer readable storage medium.

【技术实现步骤摘要】
一种网络地址的处理方法、计算设备及可读存储介质
本专利技术涉及日志分析
,尤其涉及一种网络地址的处理方法、计算设备及可读存储介质。
技术介绍
随着网络通信技术的迅速发展、所承载信息的日益丰富,互联网已成为人类社会重要的基础设施,越来越多的企业或者个人通过网络服务器以及服务器中驻留的应用向用户提供网络内容和服务。对运营这些网络服务器的企业或者个人来说,需要对网络服务器产生的日志进行分析,从而了解网络服务器的运行和访问情况。其中,某些场景下,对网络服务器的海量日志进行分析时,需要从中提取出该网络服务器的网络地址,对这些网络地址指向的网络内容进行分析。但由于提取出的网络地址数量庞大,为了降低数量级,减少工作量,通常只能从中采样进行分析。然而,这些网络地址中可能包含大量的低价值地址和少量的高价值地址,采样的方法极有可能遗漏其中的高价值地址,影响最后的分析结果。因此,迫切需要一种在减少网络地址数量的同时保证其分析质量的网络地址处理方案。
技术实现思路
为此,本专利技术提供一种网络地址的处理方案,以力图解决或者至少缓解上面存在的至少一个问题。根据本专利技术的一个方面,提供了一种网络地址的处理方本文档来自技高网...
一种网络地址的处理方法、计算设备及可读存储介质

【技术保护点】
一种网络地址的处理方法,包括步骤:获取网络日志所包含的多个网络地址;分别获取每个网络地址所包含的网络路径,以得到多个网络路径;分别获取每个网络路径的目录结构;按照目录结构所包含的子目录的个数,将所述多个网络路径划分为至少一个集合;对于所划分的每个集合,根据该集合中的网络路径的目录结构生成一个树结构;自上而下地对该树结构中每一个非叶节点下的子节点进行合并;根据合并后的树结构获取至少一个新的网络路径;以及根据所获取的新的网络路径得到新的网络地址。

【技术特征摘要】
1.一种网络地址的处理方法,包括步骤:获取网络日志所包含的多个网络地址;分别获取每个网络地址所包含的网络路径,以得到多个网络路径;分别获取每个网络路径的目录结构;按照目录结构所包含的子目录的个数,将所述多个网络路径划分为至少一个集合;对于所划分的每个集合,根据该集合中的网络路径的目录结构生成一个树结构;自上而下地对该树结构中每一个非叶节点下的子节点进行合并;根据合并后的树结构获取至少一个新的网络路径;以及根据所获取的新的网络路径得到新的网络地址。2.如权利要求1所述的方法,其中,所述网络路径的目录结构包括该网络路径所包含的子目录以及子目录的层级关系。3.如权利要求1或2所述的方法,其中,同一个集合中的网络路径的目录结构包括相同数目个子目录。4.如权利要求1-3中任一个所述的方法,其中,所述树结构以所述集合中网络路径的目录结构中的子目录为子节点,其层级关系对应于所述集合中网络路径的目录结构的层级关系。5.如权利要求1-4中任一个所述的方法,其中,所述对该树结构中每一个非叶节点下的子节点进行合并的步骤包括:对该非叶节点下的子节点,将其中具有相同值的部分子...

【专利技术属性】
技术研发人员:蔡自彬
申请(专利权)人:北京知道创宇信息技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1