网络安全知识库构建方法、设备、存储介质及装置制造方法及图纸

技术编号:34204091 阅读:14 留言:0更新日期:2022-07-20 11:25
本发明专利技术公开了一种网络安全知识库构建方法、设备、存储介质及装置,相较于现有的将网络安全信息分散存储在不同系统的不同位置的方式,本发明专利技术中,通过获取历史安全文档库,并对历史安全文档库中的历史安全文档进行词语提取,获得待处理词语集,对待处理词语集中的各待处理词语进行关联性分析,获得关联性分析结果,根据分析结果对待处理词语集进行分组,获得词义关联组以及语法关联组,根据词义关联组以及语法关联组生成待处理词语集的有向无环图,并根据有向无环图建立网络安全知识库,从而能够将网络安全信息以有向无环图的形式集中存储在网络安全知识库,进而能够提高网络安全信息的查找效率。的查找效率。的查找效率。

【技术实现步骤摘要】
网络安全知识库构建方法、设备、存储介质及装置


[0001]本专利技术涉及互联网
,尤其涉及一种网络安全知识库构建方法、设备、存储介质及装置。

技术介绍

[0002]目前,网络安全信息通常分散存储在不同系统的不同位置中,从而导致用户需要查找网络安全信息时,无法快速找到目标网络安全信息,进而降低用户体验。
[0003]上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。

技术实现思路

[0004]本专利技术的主要目的在于提供一种网络安全知识库构建方法、设备、存储介质及装置,旨在解决如何建立网络安全知识库的技术问题。
[0005]为实现上述目的,本专利技术提供一种网络安全知识库构建方法,所述网络安全知识库构建方法包括以下步骤:
[0006]获取历史安全文档库,并对所述历史安全文档库中的历史安全文档进行词语提取,获得待处理词语集;
[0007]对所述待处理词语集中的各待处理词语进行关联性分析,获得关联性分析结果;
[0008]根据所述分析结果对所述待处理词语集进行分组,获得词义关联组以及语法关联组;
[0009]根据所述词义关联组以及所述语法关联组生成所述待处理词语集的有向无环图,并根据所述有向无环图建立网络安全知识库。
[0010]可选地,所述获取历史安全文档库,并对所述历史安全文档库中的历史安全文档进行词语提取,获得待处理词语集的步骤,具体包括:
[0011]在接收到知识库构建指令时,根据所述知识库构建指令确定历史安全文档库;
[0012]对所述历史安全文档库中的历史安全文档进行遍历,将遍历到的历史安全文档作为待处理安全文档;
[0013]对所述待处理安全文档进行词语提取,获得待处理词语;
[0014]在对所述历史安全文档遍历结束后,根据所述待处理词语生成待处理词语集。
[0015]可选地,所述对所述待处理安全文档进行词语提取,获得待处理词语的步骤,具体包括:
[0016]对所述待处理安全文档进行安全短语识别,获得待处理安全短语;
[0017]对所述待处理安全短语进行命名实体识别,获得待处理词语。
[0018]可选地,所述对所述待处理安全文档进行安全短语识别,获得待处理安全短语的步骤,具体包括:
[0019]通过预设统计语言模型对所述待处理安全文档进行切割,获得初始安全短语;
[0020]获取所述初始安全短语的出现频率,并根据所述出现频率对所述初始安全短语进行筛选,获得候选安全短语;
[0021]获取所述候选安全短语的统计特征,并根据所述统计特征对所述候选安全短语进行筛选,获得待处理安全短语。
[0022]可选地,所述获取所述候选安全短语的统计特征,并根据所述统计特征对所述候选安全短语进行筛选,获得待处理安全短语的步骤,具体包括:
[0023]获取所述候选安全短语的统计特征,并根据所述统计特征生成所述候选安全短语的质量分值;
[0024]根据所述质量分值对所述候选安全短语进行排序,获得排序结果;
[0025]根据所述排序结果对所述候选安全短语进行筛选,获得待处理安全短语。
[0026]可选地,所述对所述待处理安全短语进行命名实体识别,获得待处理词语的步骤,具体包括:
[0027]对所述待处理安全短语进行序列标注,获得目标安全短语;
[0028]通过预设实体识别模型对所述目标安全短语进行命名实体识别,获得待处理词语。
[0029]可选地,所述对所述待处理词语集中的各待处理词语进行关联性分析,获得关联性分析结果的步骤,具体包括:
[0030]对所述待处理词语集中的各待处理词语进行同义词分析,获得同义词分析结果;
[0031]对所述待处理词语集中的各待处理词语进行缩略词提取,获取缩略词提取结果;
[0032]对所述待处理词语集中的各待处理词语进行语法相关性分析,获得语法分析结果;
[0033]根据所述同义词分析结果、所述缩略词提取结果、所述语法相关性分析结果生成关联性分析结果。
[0034]可选地,所述根据所述分析结果对所述待处理词语集进行分组,获得词义关联组以及语法关联组的步骤,具体包括:
[0035]根据所述同义词分析结果以及所述缩略词提取结果对所述待处理词语集进行查找,获得词义关联组;
[0036]根据所述语法相关性分析结果对所述待处理词语集进行查找,获得语法关联组。
[0037]可选地,所述根据所述词义关联组以及所述语法关联组生成所述待处理词语集的有向无环图,并根据所述有向无环图建立网络安全知识库的步骤,具体包括:
[0038]根据所述语法关联组确定自然语言三元组;
[0039]根据所述词义关联组以及所述自然语言三元组生成所述待处理词语集的有向无环图;
[0040]根据所述有向无环图建立网络安全知识库。
[0041]可选地,所述根据所述词义关联组以及所述自然语言三元组生成所述待处理词语集的有向无环图的步骤,具体包括:
[0042]根据所述词义关联组建立各待处理词语之间的词义映射关系表;
[0043]根据所述自然语言三元组建立各待处理词语之间的语法映射关系表;
[0044]根据所述词义映射关系表以及所述语法映射关系表生成所述待处理词语集的有
向无环图。
[0045]可选地,所述根据所述词义关联组以及所述语法关联组生成所述待处理词语集的有向无环图,并根据所述有向无环图建立网络安全知识库的步骤之后,所述网络安全知识库构建方法还包括:
[0046]在接收到查询指令时,根据所述查询指令确定待查询关键词;
[0047]在所述网络安全知识库中查找所述待查询关键词对应的目标有向无环图,并对所述目标有向无环图进行展示。
[0048]可选地,所述在所述网络安全知识库中查找所述待查询关键词对应的目标有向无环图,并对所述目标有向无环图进行展示的步骤,具体包括:
[0049]在所述网络安全知识库中查找所述待查询关键词对应的目标有向无环图;
[0050]根据所述查询指令确定查询设备信息,并根据所述查询设备信息确定信息展示模板;
[0051]将所述目标有向无环图写入所述信息展示模板,获得待展示信息,并对所述待展示信息进行展示。
[0052]此外,为实现上述目的,本专利技术还提出一种网络安全知识库构建设备,所述网络安全知识库构建设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的网络安全知识库构建程序,所述网络安全知识库构建程序配置为实现如上文所述的网络安全知识库构建方法的步骤。
[0053]此外,为实现上述目的,本专利技术还提出一种存储介质,所述存储介质上存储有网络安全知识库构建程序,所述网络安全知识库构建程序被处理器执行时实现如上文所述的网络安全知识库构建方法的步骤。
[0054]此外,为实现上述目的,本专利技术还提出一种网络安全知识库构本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种网络安全知识库构建方法,其特征在于,所述网络安全知识库构建方法包括以下步骤:获取历史安全文档库,并对所述历史安全文档库中的历史安全文档进行词语提取,获得待处理词语集;对所述待处理词语集中的各待处理词语进行关联性分析,获得关联性分析结果;根据所述分析结果对所述待处理词语集进行分组,获得词义关联组以及语法关联组;根据所述词义关联组以及所述语法关联组生成所述待处理词语集的有向无环图,并根据所述有向无环图建立网络安全知识库。2.如权利要求1所述的网络安全知识库构建方法,其特征在于,所述获取历史安全文档库,并对所述历史安全文档库中的历史安全文档进行词语提取,获得待处理词语集的步骤,具体包括:在接收到知识库构建指令时,根据所述知识库构建指令确定历史安全文档库;对所述历史安全文档库中的历史安全文档进行遍历,将遍历到的历史安全文档作为待处理安全文档;对所述待处理安全文档进行词语提取,获得待处理词语;在对所述历史安全文档遍历结束后,根据所述待处理词语生成待处理词语集。3.如权利要求2所述的网络安全知识库构建方法,其特征在于,所述对所述待处理安全文档进行词语提取,获得待处理词语的步骤,具体包括:对所述待处理安全文档进行安全短语识别,获得待处理安全短语;对所述待处理安全短语进行命名实体识别,获得待处理词语。4.如权利要求3所述的网络安全知识库构建方法,其特征在于,所述对所述待处理安全文档进行安全短语识别,获得待处理安全短语的步骤,具体包括:通过预设统计语言模型对所述待处理安全文档进行切割,获得初始安全短语;获取所述初始安全短语的出现频率,并根据所述出现频率对所述初始安全短语进行筛选,获得候选安全短语;获取所述候选安全短语的统计特征,并根据所述统计特征对所述候选安全短语进行筛选,获得待处理安全短语。5.如权利要求4所述的网络安全知识库构建方法,其特征在于,所述获取所述候选安全短语的统计特征,并根据所述统计特征对所述候选安全短语进行筛选,获得待处理安全短语的步骤,具体包括:获取所述候选安全短语的统计特征,并根据所述统计特征生成所述候选安全短语的质量分值;根据所述质量分值对所述候选安全短语进行排序,获得排序...

【专利技术属性】
技术研发人员:袁伟
申请(专利权)人:北京鸿享技术服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1