【技术实现步骤摘要】
一种漏洞知识图谱处理方法、装置、设备及介质
[0001]本申请涉及信息安全
,具体涉及一种漏洞知识图谱处理方法、装置、设备及介质。
技术介绍
[0002]网络安全问题一直以来备受安全研究人员关注,随着网络信息的快速增长,如何从海量数据中获得高质量、全面的漏洞数据并进行有效管理是一个亟需解决的问题。然而,现有的多个开源漏洞数据库是由不同组织维护并以不同形式进行数据存储,缺少一个统一规范,其次,多个开源漏洞数据库存在信息更新频率不一致、数据字段不一致、数据值不一致等情况,这会造成分析人员无法直观、全面、准确地理解漏洞。因此,作为网络安全风险分析的核心,从多源的大量数据中收集、整合、校验漏洞相关信息,构建漏洞知识图谱具有十分重要的意义。
[0003]目前主要是基于开源漏洞库(NVD、CNNVD、CNVD)、通用平台枚举库(CPE)、通用缺陷枚举库(CWE)等多源数据库来构建漏洞知识图谱,但是多源数据库中的字段和取值存在差异,直接基于多源数据库的解析数据构建的漏洞知识图谱会存在属性值或关系不一致/歧义的情况,这类数据将
【技术保护点】
【技术特征摘要】
1.一种漏洞知识图谱处理方法,其特征在于,包括:获取与漏洞有关的数据集;对所述数据集进行关键数据抽取,将抽取的关键数据按预设格式存入图数据库中,生成漏洞知识图谱;其中,所述漏洞知识图谱用于指示漏洞领域内各个第一类实体之间的关系和各个第一类实体的属性值;根据预先构建的漏洞知识图谱本体结构,对所述漏洞知识图谱进行信息补全和/或信息修正,获得校验后的漏洞知识图谱;其中,所述漏洞知识图谱本体结构用于指示所述漏洞领域内各个第二类实体之间的关系和各个第二类实体的属性,所述第二类实体为包括所述第一类实体的特征的实体。2.如权利要求1所述的方法,其特征在于,所述数据集包括结构化数据和非结构化数据。3.如权利要求2所述的方法,其特征在于,对所述数据集进行关键数据抽取,将抽取的关键数据按预设格式存入图数据库中,包括:将所述非结构化数据输入训练后的实体识别模型,获得所述非结构化数据中每个词的第一标签和第二标签;其中,所述第一标签用于指示每个词不是实体类型、或者词是实体片段的开始、或者词是实体片段的中间、或者词是实体片段的结束,所述第二标签用于指示词是实体时对应的实体类型;根据每个词的第一标签和第二标签,从所述非结构化数据中抽取多个第一词进行合并,获得多个第二词;其中,所述第一词为第一标签是实体片段的开始或实体片段的中间或实体片段的结束、且第二标签相同的词,每个第二词对应一个第一类实体;将所述多个第二词对应的多个第一类实体之间的关系、以及所述多个第二词对应的多个第一类实体的属性值,按预设格式存入图数据库中;其中,所述多个第二词对应的多个第一类实体之间的关系是根据所述漏洞知识图谱本体结构确定的,所述多个第二词对应的多个第一类实体的属性值是根据所述多个第二词确定的。4.如权利要求1
‑
3任一项所述的方法,其特征在于,根据预先构建的漏洞知识图谱本体结构,对所述漏洞知识图谱进行信息补全和/或信息修正,获得校验后的漏洞知识图谱,包括:根据所述漏洞知识图谱本体结构,确定所述漏洞知识图谱中的漏洞实体的缺失信息和/或错误信息;若所述缺失信息为多个,按照预设的第一优先级,依次对所述漏洞知识图谱进行信息补全,和/或,若所述错误信息为多个,按照预设的第二优先级,依次对所述漏洞知识图谱进行信息修正;获得所述校验后的漏洞知识图谱。5.如权利要求1
‑
3任一项所述的方法,其特征在于,在获得校验后的漏洞知识图谱之后,所述方...
【专利技术属性】
技术研发人员:周娟,袁军,章瑞康,张龙,刘勤亮,顾杜娟,
申请(专利权)人:北京神州绿盟科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。