一种基于等价结构挖掘网络资产图的化简方法技术

技术编号:32482881 阅读:14 留言:0更新日期:2022-03-02 09:47
本发明专利技术公开了一种基于等价结构挖掘网络资产图的化简方法,该方法包括:S01、分类并定义等价结构:将等价结构进行分类并定义各类的判别方法;S02、统计并为等价结构节点贴上标签:根据步骤S01定义的等价结构以及判别方法对原始数据进行统计,为对应等价结构的节点标识特定的标签,然后进行分类;S03、设计化简方案:根据步骤S02的分类及统计结果,通过化简比例计算函数进行“非独立型等价结构”的化简,通过固定的化简方案对“独立型弱等价结构”进行化简;S04、根据等价结构化简比例处理数据。本申请可以有效解决资产图谱中视觉冗余的问题,同时还能保持化简前后整体拓扑结构的一致性,适合推广应用。适合推广应用。适合推广应用。

【技术实现步骤摘要】
一种基于等价结构挖掘网络资产图的化简方法


[0001]本专利技术属于数据可视化
,特别涉及一种基于等价结构挖掘网络资产图的化简方法。

技术介绍

[0002]网络资产图谱中,丰富的资产之间通过各种各样的方式产生关联,形成了错综复杂的资产图谱拓扑结构。这种点、边双异质的高复杂性资产图谱中包含有丰富多样的局部结构,在业务层面和拓扑结构层面等都具有一定的意义。特别是,在这些局部结构中,存在一些等价结构,它们在拓扑上、业务上、视觉上都表现出高度相似性,也可以认为是冗余性。例如,在网络资产的图谱中,簇型结构(或星型结构)是非常常见的。在网络黑(灰)产图谱中,从业务上,这类结构很可能是一个团伙,而从拓扑结构上,这类结构往往又体型庞大,且内部具有一致性(如图2),容易造成视觉上的冗余。由于其内部结构相似,所以对其拓扑结构进行一定程度上的化简不会影响其业务逻辑。又例如,桥型结构在网络资产图谱中也是非常常见的。在网络黑(灰)产图谱中,从业务上,这类结构很可能联系两个团伙,而从拓扑结构上,这类结构内部同样基本一致(如图3),容易造成视觉上的冗余。

技术实现思路

[0003]为解决目前技术存在的缺陷和不足,本专利技术的目的在于提供一种基于等价结构挖掘网络资产图的化简方法。该化简方法有效地解决了资产图谱中视觉冗余的问题,同时还能保持化简前后整体拓扑结构的一致性,以帮助人们对网络资产图谱的研究和可视分析,适合推广应用。
[0004]本专利技术的目的通过下述技术方案实现:
[0005]一种基于等价结构挖掘网络资产图的化简方法,包括如下步骤:
[0006]S01、分类并定义等价结构:将等价结构分类为一级簇级结构、桥级结构、簇桥结构、多级簇结构以及独立型弱等价结构,并定义所述一级簇级结构、桥级结构、簇桥结构、多级簇结构以及独立型弱等价结构的判别方法;
[0007]S02、统计并为等价结构节点贴上标签:根据步骤S01定义的等价结构以及判别方法对原始数据进行统计,为对应等价结构的节点标识特定的标签,然后进行分类;
[0008]S03、设计化简方案:根据步骤S02的分类及统计结果,通过化简比例计算函数进行“非独立型等价结构”的化简,通过固定的化简方案对“独立型弱等价结构”进行化简;
[0009]S04、根据等价结构化简比例处理化简数据。
[0010]进一步地,所述基于等价结构挖掘网络资产图的化简方法,还包括如下步骤:S05、迭代优化化简方案:根据图谱的化简效果,对比评估化简效果对整体拓扑结构以及业务逻辑的影响程度,进行迭代优化化简方案。
[0011]进一步地,步骤S01中,
[0012]所述一级簇级结构、桥级结构、簇桥结构以及多级簇结构为非独立型等价结构;所
述一级簇级结构为度数为1、且与簇中心节点相连的数量大于3的节点群。
[0013]在本申请中,所述等价结构的分离基于局部特征规律进行分类。原始数据里的节点已经带有是否为簇中心节点的标签。
[0014]进一步地,步骤S03中,
[0015]所述化简比例计算函数的通式如下:
[0016][0017]其中,e
i
为案例i中所有等价结构占比;σ是根据经验值设置的化简效果较好、且能保持化简前后图的可视化视觉效果的推荐化简系数(默认情况下取值为1.2);S
i
为案例i的等价结构化简比例。
[0018]所述“非独立型等价结构”的化简包括:根据所述化简比例计算函数,当案例i的等价结构占比不超过50%(即e
i
≤0.5)时,采用一次函数进行化简比例计算;当案例i的等价结构占比超过50%(即0.5<e
i
≤1)时,采用二次函数进行化简比例计算。
[0019]由于e
i
≤0.5时,不会为资产图谱带来比较严重的视觉影响,因此,对其进行较小程度的等价结构化简,并且采用较为平滑的一次函数作为此段的化简比例计算函数。
[0020]由于0.5<e
i
≤1时,会为资产图谱带来较大的视觉影响,同时还会使得该案例的资产图谱具有非常严重的视觉冗余,因此,对其进行较大程度的等价结构化简。根据本申请经验值,当化简率超过60%时会使得化简后的资产图谱产生较大变化,这种变化很有可能会改变用户对资产图谱的理解,甚至会改变资产图谱原本的拓扑结构特征,故采用随等价结构占比的增长,化简比例增长趋于平缓的二次函数。
[0021]所述通过固定的化简方案对“独立型弱等价结构”进行化简包括:将“独立型弱等价结构”分为重要“独立型弱等价结构”、普通“独立型弱等价结构”和非重要“独立型弱等价结构”;首先,对重要“独立型弱等价结构”不进行化简;然后,对于普通“独立型弱等价结构”,随机丢弃其中40%的节点;接着,对于非重要“独立型弱等价结构”,随机丢弃其中60%的节点。
[0022]在本申请中,根据网络安全专家评估,将“独立型弱等价结构”分为重要“独立型弱等价结构”、普通“独立型弱等价结构”和非重要“独立型弱等价结构”;然后,基于业务逻辑考虑,首先,对于重要“独立型弱等价结构”,直接跳过该类结构,不对它做任何化简;然后,对于普通“独立型弱等价结构”,随机丢弃其中40%的节点;最后,对于非重要“独立型弱等价结构”,随机丢弃其中60%的节点。这样就可以在保留重要“独立型弱等价结构”的同时,有效减少其他“独立型弱等价结构”的组数,还能在一定程度上减少资产图谱分析过程中的干扰节点,达到化简网络资产图谱中等价结构的目的。
[0023]进一步地,步骤S04中,所述处理化简数据包括:
[0024]S04.1、“非独立型等价结构”化简:根据等价结构化简比例,随机删除各个等价结构中的节点,使数据达到等价结构化简比例的要求;这样,可以保持数据的合理性以及图谱中各个等价结构拓扑结构相对稳定。
[0025]进一步地,步骤S04中,所述处理化简数据还包括:
[0026]S04.2、“独立型弱等价结构”化简:将“独立型弱等价结构”分为重要“独立型弱等价结构”、普通“独立型弱等价结构”和非重要“独立型弱等价结构”;然后,分别设定重要“独
立型弱等价结构”、普通“独立型弱等价结构”和非重要“独立型弱等价结构”的等价结构化简比例,根据相应的等价结构化简比例分别对重要“独立型弱等价结构”、普通“独立型弱等价结构”和非重要“独立型弱等价结构”进行化简。
[0027]本专利技术相对于现有技术具有如下的优点及效果:通过本申请的方法,可以将等价结构挖掘应用于网路资产图谱的化简,有效解决资产图谱中视觉冗余的问题,同时还能保持化简前后整体拓扑结构的一致性,可以帮助人们对网络资产图谱进行研究和可视分析,为检查图中等价结构的挖掘、统计与分析提供了一种准确快速的方法,可以在保持业务逻辑的前提下简化网络资产图谱,提高视图的美观性以及简约性,适合推广应用。
附图说明
[0028]图1为本专利技术实施例基于等价结构挖掘的网络资产图化简方法的流程本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于等价结构挖掘网络资产图的化简方法,其特征在于,包括如下步骤:S01、分类并定义等价结构:将等价结构分类为一级簇级结构、桥级结构、簇桥结构、多级簇结构以及独立型弱等价结构,并定义所述一级簇级结构、桥级结构、簇桥结构、多级簇结构以及独立型弱等价结构的判别方法;S02、统计并为等价结构节点贴上标签:根据步骤S01定义的等价结构以及判别方法对原始数据进行统计,为对应等价结构的节点标识特定的标签,然后进行分类;S03、设计化简方案:根据步骤S02的分类及统计结果,通过化简比例计算函数进行“非独立型等价结构”的化简,通过固定的化简方案对“独立型弱等价结构”进行化简;S04、根据等价结构化简比例处理化简数据。2.根据权利要求1所述的基于等价结构挖掘网络资产图的化简方法,其特征在于,所述基于等价结构挖掘网络资产图的化简方法,还包括如下步骤:S05、迭代优化化简方案:根据图谱的化简效果,对比评估化简效果对整体拓扑结构以及业务逻辑的影响程度,进行迭代优化化简方案。3.根据权利要求1所述的基于等价结构挖掘网络资产图的化简方法,其特征在于,步骤S01中,所述一级簇级结构、桥级结构、簇桥结构以及多级簇结构为非独立型等价结构;所述一级簇级结构为度数为1、且与簇中心节点相连的数量大于3的节点群。4.根据权利要求3所述的基于等价结构挖掘网络资产图的化简方法,其特征在于,步骤S03中,所述化简比例计算函数的通式如下:其中,e
i
为案例i中所有等价结构占比;σ是根据经验值设置的化简效果较好、且能保持化简前后图的可视化视觉效果的推荐化简系数;S
i
为案例i的等价结构化简比例。5.根据权利要求4所述的基于等价结...

【专利技术属性】
技术研发人员:周芳芳陈运鹏赵鑫焦双城张驰周雨侬赵勇赵颖陈卓李玉伟林子翔黄鑫赵晋龙
申请(专利权)人:奇安信科技集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1