网络应用信息合并方法、装置、电子设备和存储介质制造方法及图纸

技术编号:38757954 阅读:12 留言:0更新日期:2023-09-10 09:42
本发明专利技术提供一种网络应用信息合并方法、装置、电子设备和存储介质,通过提取内网网络流量涉及的网络地址,作为网络流量对应的应用标识,再基于各个网络流量对应的应用标识中的网络协议和域名层级,对各个网络流量对应的应用标识进行分组,得到多个应用标识组,继而针对任一应用标识组,计算得到该应用标识组的任意两个应用标识中各层级域名之间的层级相似度,并基于任意两个应用标识中各层级域名之间的层级相似度,确定任意两个应用标识的域名相似度,从而基于各个应用标识组中任意两个应用标识的域名相似度对各个应用标识组中的应用标识进行合并,得到多个域名合并组,实现了网络应用信息的快速、精准合并。精准合并。精准合并。

【技术实现步骤摘要】
网络应用信息合并方法、装置、电子设备和存储介质


[0001]本专利技术涉及信息处理
,尤其涉及一种网络应用信息合并方法、装置、电子设备和存储介质。

技术介绍

[0002]在做网络资产信息梳理时,会出现很多域名或IP地址不相同,但实际属于同一个网络应用的情况,从而造成梳理出的网络资产信息存在大量的重复现象,不利于网络资产管理者掌握实际的网络资产状态。因此,需要对网络应用进行合并,得到更精确的网络资产信息。然而,目前在合并网络应用时需要人工识别并筛选出可以合并的应用,继而调用程序进行合并,费时费力,效率低下,且容易产生遗漏,导致合并后的网络资产信息中仍存在大量的重复网络应用信息。

技术实现思路

[0003]本专利技术提供一种网络应用信息合并方法、装置、电子设备和存储介质,用以解决现有技术中费时费力,效率低下,且容易产生遗漏的缺陷。
[0004]本专利技术提供一种网络应用信息合并方法,包括:采集内网的多个网络流量,并提取所述网络流量涉及的网络地址,作为所述网络流量对应的应用标识;其中,任一网络流量涉及的网络地址包括网络协议和域名,或者包括网络协议和IP地址;基于各个网络流量对应的应用标识中的网络协议和域名层级,对所述各个网络流量对应的应用标识进行分组,得到多个应用标识组;其中,任一应用标识组的应用标识中的网络协议和域名层级相同;针对任一应用标识组,计算得到所述任一应用标识组的任意两个应用标识中各层级域名之间的层级相似度,并基于所述任意两个应用标识中各层级域名之间的层级相似度,确定所述任意两个应用标识的域名相似度;基于各个应用标识组中任意两个应用标识的域名相似度对所述各个应用标识组中的应用标识进行合并,得到多个域名合并组;所述域名合并组中的应用标识对应同一网络应用。
[0005]根据本专利技术提供的一种网络应用信息合并方法,所述基于各个网络流量对应的应用标识中的网络协议和域名层级,对所述各个网络流量对应的应用标识进行分组,得到多个应用标识组,具体包括:将采集的网络流量对应的应用标识进行划分,得到应用标识包括网络协议和域名的第一网络流量组和应用标识包括网络协议和IP地址的第二网络流量组;针对所述第一网络流量组,基于所述第一网络流量组中各个网络流量对应的应用标识中的网络协议和域名层级,对所述各个网络流量对应的应用标识进行分组,得到多个应用标识组。
[0006]根据本专利技术提供的一种网络应用信息合并方法,所述方法还包括:采集所述第一网络流量组和第二网络流量组中各个网络流量中包含的应用URL地址,并基于所述各个网络流量中包含的应用URL地址,确定所述各个网络流量调用的接口信息;确定所述第二网络流量组中任意两个网络流量调用的接口信息之间的接口相似度,和/或,确定所述第二网络流量组中网络流量调用的接口信息与所述第一网络流量组中网络流量调用的接口信息之间的接口相似度;基于所述第二网络流量组中任意两个网络流量调用的接口信息之间的接口相似度,和/或,基于所述第二网络流量组中网络流量调用的接口信息与所述第一网络流量组中网络流量调用的接口信息之间的接口相似度,对相应网络流量对应的应用标识进行合并。
[0007]根据本专利技术提供的一种网络应用信息合并方法,所述基于所述第二网络流量组中任意两个网络流量调用的接口信息之间的接口相似度,和/或,基于所述第二网络流量组中网络流量调用的接口信息与所述第一网络流量组中网络流量调用的接口信息之间的接口相似度,对相应网络流量对应的应用标识进行合并,具体包括:基于所述第二网络流量组中任意两个网络流量调用的接口信息之间的接口相似度,对所述第二网络流量组中的各个网络流量对应的应用标识进行合并,得到多个初始合并组;针对任一初始合并组,基于所述任一初始合并组中各个应用标识对应的网络流量调用的接口信息与各个域名合并组中各个应用标识对应的网络流量调用的接口信息之间的接口相似度,从所述各个域名合并组中确定所述任一初始合并组对应的相似域名合并组;基于所述任一初始合并组中各个应用标识对应的网络流量调用的接口信息与所述相似域名合并组中各个应用标识对应的网络流量调用的接口信息之间的接口相似度,将所述任一初始合并组中的应用标识合并至所述相似域名合并组中。
[0008]根据本专利技术提供的一种网络应用信息合并方法,所述针对所述第一网络流量组,基于所述第一网络流量组中各个网络流量对应的应用标识中的网络协议和域名层级,对所述各个网络流量对应的应用标识进行分组,得到多个应用标识组,之后还包括:若任一应用标识组中任意两个应用标识的一级域名不相同,则不对所述任意两个应用标识进行合并。
[0009]根据本专利技术提供的一种网络应用信息合并方法,所述基于各个应用标识组中任意两个应用标识的域名相似度对所述各个应用标识组中的应用标识进行合并,具体包括:若任一应用标识组中任意两个应用标识的域名相似度大于域名相似度阈值,则将所述任一应用标识组中的所述任意两个应用标识进行合并;若任一应用标识组中任意两个应用标识的域名相似度小于或等于域名相似度阈值,则确定所述任意两个应用标识对应的网络流量调用的接口信息之间的接口相似度,并基于所述任意两个应用标识对应的网络流量调用的接口信息之间的接口相似度,判断是否将所述任意两个应用标识进行合并。
[0010]根据本专利技术提供的一种网络应用信息合并方法,所述基于所述任意两个应用标识中各层级域名之间的层级相似度,确定所述任意两个应用标识的域名相似度,具体包括:
基于相应应用标识组对应的各层级域名的权重对所述任意两个应用标识中各层级域名之间的层级相似度进行加权求和,得到所述任意两个应用标识的域名相似度;其中,所述应用标识组对应的各层级域名的权重是基于各层级域名在所述应用标识组对应的域名结构中的层级确定的;任一层级域名在所述应用标识组对应的域名结构中的层级越高,所述任一层级域名的权重越高。
[0011]本专利技术还提供一种网络应用信息合并装置,包括:网络流量提取单元,用于采集内网的多个网络流量,并提取所述网络流量涉及的网络地址,作为所述网络流量对应的应用标识;其中,任一网络流量涉及的网络地址包括网络协议和域名,或者包括网络协议和IP地址;应用标识分组单元,用于基于各个网络流量对应的应用标识中的网络协议和域名层级,对所述各个网络流量对应的应用标识进行分组,得到多个应用标识组;其中,任一应用标识组的应用标识中的网络协议和域名层级相同;域名相似度计算单元,用于针对任一应用标识组,计算得到所述任一应用标识组的任意两个应用标识中各层级域名之间的层级相似度,并基于所述任意两个应用标识中各层级域名之间的层级相似度,确定所述任意两个应用标识的域名相似度;应用标注合并单元,用于基于各个应用标识组中任意两个应用标识的域名相似度对所述各个应用标识组中的应用标识进行合并,得到多个域名合并组;所述域名合并组中的应用标识对应同一网络应用。
[0012]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述网络应用信息合并方法。
[0013]本发本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种网络应用信息合并方法,其特征在于,包括:采集内网的多个网络流量,并提取所述网络流量涉及的网络地址,作为所述网络流量对应的应用标识;其中,任一网络流量涉及的网络地址包括网络协议和域名,或者包括网络协议和IP地址;基于各个网络流量对应的应用标识中的网络协议和域名层级,对所述各个网络流量对应的应用标识进行分组,得到多个应用标识组;其中,任一应用标识组的应用标识中的网络协议和域名层级相同;针对任一应用标识组,计算得到所述任一应用标识组的任意两个应用标识中各层级域名之间的层级相似度,并基于所述任意两个应用标识中各层级域名之间的层级相似度,确定所述任意两个应用标识的域名相似度;基于各个应用标识组中任意两个应用标识的域名相似度对所述各个应用标识组中的应用标识进行合并,得到多个域名合并组;所述域名合并组中的应用标识对应同一网络应用。2.根据权利要求1所述的网络应用信息合并方法,其特征在于,所述基于各个网络流量对应的应用标识中的网络协议和域名层级,对所述各个网络流量对应的应用标识进行分组,得到多个应用标识组,具体包括:将采集的网络流量对应的应用标识进行划分,得到应用标识包括网络协议和域名的第一网络流量组和应用标识包括网络协议和IP地址的第二网络流量组;针对所述第一网络流量组,基于所述第一网络流量组中各个网络流量对应的应用标识中的网络协议和域名层级,对所述各个网络流量对应的应用标识进行分组,得到多个应用标识组。3.根据权利要求2所述的网络应用信息合并方法,其特征在于,所述方法还包括:采集所述第一网络流量组和第二网络流量组中各个网络流量中包含的应用URL地址,并基于所述各个网络流量中包含的应用URL地址,确定所述各个网络流量调用的接口信息;确定所述第二网络流量组中任意两个网络流量调用的接口信息之间的接口相似度,和/或,确定所述第二网络流量组中网络流量调用的接口信息与所述第一网络流量组中网络流量调用的接口信息之间的接口相似度;基于所述第二网络流量组中任意两个网络流量调用的接口信息之间的接口相似度,和/或,基于所述第二网络流量组中网络流量调用的接口信息与所述第一网络流量组中网络流量调用的接口信息之间的接口相似度,对相应网络流量对应的应用标识进行合并。4.根据权利要求3所述的网络应用信息合并方法,其特征在于,所述基于所述第二网络流量组中任意两个网络流量调用的接口信息之间的接口相似度,和/或,基于所述第二网络流量组中网络流量调用的接口信息与所述第一网络流量组中网络流量调用的接口信息之间的接口相似度,对相应网络流量对应的应用标识进行合并,具体包括:基于所述第二网络流量组中任意两个网络流量调用的接口信息之间的接口相似度,对所述第二网络流量组中的各个网络流量对应的应用标识进行合并,得到多个初始合并组;针对任一初始合并组,基于所述任一初始合并组中各个应用标识对应的网络流量调用的接口信息与各个域名合并组中各个应用标识对应的网络流量调用的接口信息之间的接口相似度,从所述各个域名合并组中确定所述任一初始合并组对应的相似域名合并组;
基于所述任一初始合并组中各个应用标识对应的网络流量调用的接口信息与所述相似域名合并组中各个应用标识...

【专利技术属性】
技术研发人员:张黎赵龙祥
申请(专利权)人:闪捷信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1