网络安全本体的构建方法、装置、电子设备及存储介质制造方法及图纸

技术编号:39323096 阅读:5 留言:0更新日期:2023-11-12 16:02
本申请实施例提供一种网络安全本体的构建方法、装置、电子设备及存储介质,该方法包括:获取与网络安全本体的构建需求对应的网络安全数据,其中,网络安全数据至少包括结构化网络安全数据和非结构化网络安全数据;根据结构化网络安全数据,构建与结构化网络安全数据对应的初始多叉树;根据非结构化网络安全数据对初始多叉树进行更新,得到更新后的目标多叉树;根据目标多叉树,生成与网络安全本体的构建需求对应的网络安全本体文件,克服现有技术需要人工进行构建,以及处理数据来源单一,处理数据格式适配性差的问题,提高了生成本体文件的效率。件的效率。件的效率。

【技术实现步骤摘要】
网络安全本体的构建方法、装置、电子设备及存储介质


[0001]本申请涉及网络安全
,具体而言,涉及一种网络安全本体的构建方法、装置、电子设备及存储介质。

技术介绍

[0002]近年来网络攻击发生频繁,攻击手段多样,为网络安全保障带来了严峻的挑战。互联网中存在大量的网络安全相关的数据,例如防火墙、入侵检测系统等监测到的网络安全告警数据、网络安全研究机构或厂商建立的漏洞信息库,以及互联网安全论坛和厂商发布的安全通告等。由于这些网络安全数据具有离散化、碎片化的特点,无法从这些网络安全数据中获取到网络安全态势。
[0003]随着科学技术的不断发展,可以将安全本体技术应用于网络安全中,安全本体技术是采用一种名为“本体”的知识表示方法,将安全领域内的知识以一种可共享且无歧义的方式表达出来,其具体表现形式是一个或若干个符合特定结构要求的文件。
[0004]目前需要人工进行本体构建,不仅费时费力,而且难以满足大规模本体构建的需求,因此,如何实现自动构建本体,提高本体构建效率是目前急需解决的问题。

技术实现思路

[0005]本申请的一些实施例的目的在于提供一种网络安全本体的构建方法、装置、电子设备及存储介质,通过本申请的实施例的技术方案,通过获取与网络安全本体的构建需求对应的网络安全数据,其中,所述网络安全数据至少包括结构化网络安全数据和非结构化网络安全数据;根据所述结构化网络安全数据,构建与所述结构化网络安全数据对应的初始多叉树;根据所述非结构化网络安全数据对所述初始多叉树进行更新,得到更新后的目标多叉树;根据所述目标多叉树,生成与所述网络安全本体的构建需求对应的网络安全本体文件,本申请实施例通过根据网络安全本体的构建需求,先采用结构化网络安全数据构建初始多叉树,然后再采用非结构化网络安全数据对该初始多叉树的各个节点进行更新,得到目标多叉树,并根据目标多叉树生成与网络安全本体的构建需求对应的网络安全本体文件,克服现有技术需要人工进行构建,以及处理数据来源单一,处理数据格式适配性差的问题,提高了生成本体文件的效率。
[0006]第一方面,本申请的一些实施例提供了一种网络安全本体的构建方法,包括:
[0007]获取与网络安全本体的构建需求对应的网络安全数据,其中,所述网络安全数据至少包括结构化网络安全数据和非结构化网络安全数据;
[0008]根据所述结构化网络安全数据,构建与所述结构化网络安全数据对应的初始多叉树;
[0009]根据所述非结构化网络安全数据对所述初始多叉树进行更新,得到更新后的目标多叉树;
[0010]根据所述目标多叉树,生成与所述网络安全本体的构建需求对应的网络安全本体
文件。
[0011]本申请的一些实施例通过根据网络安全本体的构建需求,先采用结构化网络安全数据构建初始多叉树,然后再采用非结构化网络安全数据对该初始多叉树的各个节点进行更新,得到目标多叉树,并根据目标多叉树生成与网络安全本体的构建需求对应的网络安全本体文件,克服现有技术需要人工进行构建,以及处理数据来源单一,处理数据格式适配性差的问题,提高了生成本体文件的效率。
[0012]可选地,所述根据所述结构化网络安全数据,构建与所述结构化网络安全数据对应的初始多叉树,包括:
[0013]将所述结构化网络安全数据转换成类包,其中,所述类包至少包括完整类名、数据属性、方法属性和约束;
[0014]根据所述类包中的完整类名、数据属性、方法属性、约束以及类间关系确定为初始多叉树的各个节点;
[0015]采用分裂层次聚类方法,对所述各个节点进行合并和删除,得到所述初始多叉树。
[0016]本申请的一些实施例通过采集结构化、非结构化的网络安全数据,能够自动地将多源异构的网络安全数据转换为便于处理的中间格式,是后续本体概念提取和本体生成的关键支撑,从安全数据的中间格式中提取本体要素,包括概念、概念间的层次关系、概念间的非层次关系等,并使用统一的多叉树数据结构存储提取本体要素之后的本体模型。
[0017]可选地,所述将所述类包中的属性、方法、类间关系提取为初始多叉树的节点,包括:
[0018]将所述完整类名映射为初始多叉树的节点概念名,类名路径分解为根节点和概念叶子节点之间的节点;
[0019]将所述类包中的数据属性映射为节点数据属性,保留数据属性的名称;
[0020]将所述类包中的方法属性映射为节点对象属性,保留方法属性的名称;将所述约束转换为节点公理属性。
[0021]本申请的一些实施例通过将多叉树和本体文件相对应,重点完成了概念和概念间关系的构建,创新性地使用Java类包作为中间形式,保留了相对完整的数据源语义信息。
[0022]可选地,所述采用分裂层次聚类方法,对所述各个节点进行合并和删除,得到所述初始多叉树,包括:
[0023]获取所述初始多叉树的所有节点中的同名概念节点;
[0024]将所述同名概念节点和与所述同名概念节点对应的标识以键值对进行分组存储,并分组处理同名概念节点;
[0025]计算所述同名概念节点之间的语义距离;
[0026]根据所述语义距离和预设阈值,判断是否对同名概念节点进行分簇,得到判断结果;
[0027]根据所述判断结果,对所述同名概念节点进行合并和删除,得到所述初始多叉树。
[0028]本申请的一些实施例,采用分裂层次聚类和凝聚层次聚类方法,分别针对结构化数据的本体学习和非结构化数据的本体学习,能够更好地处理概念的重复和冲突问题。
[0029]可选地,所述根据所述非结构化网络安全数据对所述初始多叉树进行更新,得到更新后的目标多叉树,包括:
[0030]采用自然语言处理工具,对所述非结构化安全数据进行处理,得到与所述非结构化安全数据对应的概念信息;
[0031]计算所述概念信息与所述初始多叉树中的每一个节点的语义相似度;
[0032]根据所述语义相似度和预设字符串相似度阈值,判断是否对所述初始多叉树进行更新;
[0033]根据判断结果,确定所述目标多叉树。
[0034]本申请的一些实施例通过在建立的结构化安全数据对应的多叉树的基础上,采用非结构化安全数据对多叉树上的节点进行更新,这样,可以将不同类型都进行处理,使得生成的多叉树覆盖的数据更全面。
[0035]可选地,所述根据所述语义相似度和预设字符串相似度阈值,判断是否对所述初始多叉树进行更新,包括:
[0036]若所述语义相似度大于或等于所述预设字符串,将所述概念信息和所述初始多叉树进行聚合;
[0037]若所述语义相似度小于所述预设字符串,将所述概念信息作为所述初始多叉树的当前节点的子节点,对所述初始多叉树进行更新。
[0038]本申请的一些实施例通过在建立的结构化安全数据对应的多叉树的基础上,计算非结构化安全数据和多叉树上的节点的相似度,根据相似度对多叉树上的节点进行聚合和删除,得到更加准确的多叉树。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种网络安全本体的构建方法,其特征在于,所述方法包括:获取与网络安全本体的构建需求对应的网络安全数据,其中,所述网络安全数据至少包括结构化网络安全数据和非结构化网络安全数据;根据所述结构化网络安全数据,构建与所述结构化网络安全数据对应的初始多叉树;根据所述非结构化网络安全数据对所述初始多叉树进行更新,得到更新后的目标多叉树;根据所述目标多叉树,生成与所述网络安全本体的构建需求对应的网络安全本体文件。2.根据权利要求1所述的网络安全本体的构建方法,其特征在于,所述根据所述结构化网络安全数据,构建与所述结构化网络安全数据对应的初始多叉树,包括:将所述结构化网络安全数据转换成类包,其中,所述类包至少包括完整类名、数据属性、方法属性和约束;根据所述类包中的完整类名、数据属性、方法属性、约束以及类间关系确定为初始多叉树的各个节点;采用分裂层次聚类方法,对所述各个节点进行合并和删除,得到所述初始多叉树。3.根据权利要求2所述的网络安全本体的构建方法,其特征在于,所述根据所述类包中的完整类名、数据属性、方法属性、约束以及类间关系确定为初始多叉树的各个节点,包括:将所述完整类名映射为初始多叉树的节点概念名,类名路径分解为根节点和概念叶子节点之间的节点;将所述类包中的数据属性映射为节点数据属性,保留数据属性的名称;将所述类包中的方法属性映射为节点对象属性,保留方法属性的名称;将所述约束转换为节点公理属性。4.根据权利要求2所述的网络安全本体的构建方法,其特征在于,所述采用分裂层次聚类方法,对所述各个节点进行合并和删除,得到所述初始多叉树,包括:获取所述初始多叉树的所有节点中的同名概念节点;将所述同名概念节点和与所述同名概念节点对应的标识以键值对进行分组存储,并分组处理同名概念节点;计算所述同名概念节点之间的语义距离;根据所述语义距离和预设阈值,判断是否对同名概念节点进行分簇,得到判断结果;根据所述判断结果,对所述同名概念节点进行合并和删除,得到所述初始多叉树。5.根据权利要求2所述的网络安全本体的构建方法,其特征在于,所述根据所述非结构化网络安全数据对所述初始多叉树进行更新,得到更新后的目标多叉树,包括:采用自然语言处理工具,对所述非结构化安全数据进行处理,得到与所述非结构化安全数据对应的概念...

【专利技术属性】
技术研发人员:王一琁赵波宋晓芙李娇
申请(专利权)人:北京天融信网络安全技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1