【技术实现步骤摘要】
一种多源异构的网络安全知识图谱构建与应用方法
本专利技术涉及一种多源异构的网络安全知识图谱构建与应用的方法,属于网络安全、知识图谱
技术介绍
对于安全分析人员来说尽管许多漏洞和攻击信息是公开可用的,例如安全漏洞相关数据集:NVD、CVE,攻击类型数据集CPAEC等数据集。但是,这些信息分散在异构的和复杂的信息条目中,这些条目之间没有相互的联系和集成。大量的多源异构漏洞数据给安全分析人员的查询和处理带来麻烦。相关的安全知识是分散的和不全的,难以实现共享和重用,从而不能对软件系统进行全面准确的安全分析。知识图谱是一种具有有向图结构的知识库,最早由谷歌提出用来改善搜索引擎。知识图谱中包含节点和边。其中节点代表实体,边表示不同实体之间的语义关系或者是实体的属性。具有关系的节点之间存在一条或多条边。知识图谱包括通用知识图谱和领域知识图谱。其中通用知识图谱包括Freebase和YaGo等。领域知识图谱包括医疗领域的知识图谱、金融领域知识图谱、学术领域知识图谱Aminer等。知识图谱主要基于半结构化数据和非结构化 ...
【技术保护点】
1.一种多源异构的网络安全知识图谱构建与应用方法,其特征在于,包括以下步骤:/n步骤1:依据网络安全领域相关标准,构建网络安全知识本体;/n步骤2:收集网络安全领域公开的数据集并进行数据预处理/n数据集包含结构化数据、半结构化的XML数据、非结构化数据,所述的预处理为编写解析器将XML类型的数据解析为结构化数据;/n步骤3:多源异构网络安全数据的知识抽取和融合/n所述的知识抽取具体为:从每个数据集的非结构化数据中抽取安全实体,以及安全实体之间的关系,其中,采用命名实体识别工具抽取安全实体,命名实体识别工具为训练完毕的Stanford NLP命名实体识别器,抽取安全实体之间关 ...
【技术特征摘要】
1.一种多源异构的网络安全知识图谱构建与应用方法,其特征在于,包括以下步骤:
步骤1:依据网络安全领域相关标准,构建网络安全知识本体;
步骤2:收集网络安全领域公开的数据集并进行数据预处理
数据集包含结构化数据、半结构化的XML数据、非结构化数据,所述的预处理为编写解析器将XML类型的数据解析为结构化数据;
步骤3:多源异构网络安全数据的知识抽取和融合
所述的知识抽取具体为:从每个数据集的非结构化数据中抽取安全实体,以及安全实体之间的关系,其中,采用命名实体识别工具抽取安全实体,命名实体识别工具为训练完毕的StanfordNLP命名实体识别器,抽取安全实体之间关系的过程为:对每个数据集中抽取的安全实体进行人为少量标注,形成每个数据集的种子集合,即找到每个数据集存在关联关系的少量安全实体对,然后采用Bootstrapping算法从每个数据集的非结构化数据中提取所有的安全实体对;
所述的融合用于把不同数据集中有关联的实体建立联系,具体建立过程是通过爬取安全网站提供的对应ID之间的关系完成的。
步骤4:网络安全知识图谱的映射和推理;
步骤5:将网络安全知识图谱和目标系统的UML部署图作为输入,通过构造SPARQL语句查询推理当前环境中的可能发生的安全问题和防御措施。
2.根据权利要求1所述的一种多源异构网络安全知识图谱构建与应用的方法,其特征在于:步骤1中网络安全知识本体的构建主要过程:利用Protege本体建模工具,并使用收集的安全领域核心的术语、概念和定义,建立层次化网络安全概念结构,所述的概念结构为多层结构,首层为网络安全顶层本体,第n层是对第n-1层中每个概念的进一步分类,此外还包括表征顶层本体之间的关系。
3.根据权利要求2所述的一种多源异构网络安全知识图谱构建与应用的方法,其特征在于:所述的顶层本体为资产、脆弱性、攻击、影响、防御。
4.根据权利要求3所述的...
【专利技术属性】
技术研发人员:王国迪,李童,杨震,
申请(专利权)人:北京工业大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。