一种知识图谱构建方法及相关装置制造方法及图纸

技术编号:32969645 阅读:11 留言:0更新日期:2022-04-09 11:33
本申请公开了一种知识图谱构建方法,包括:基于网络安全数据模型从数据源进行数据提取,获得实体数据和关系数据;其中,网络安全数据模型为根据网络数据的安全特征构建的针对于实体类型、关系类型以及属性信息的数据模型;采用实体数据和关系数据进行知识图谱构建,得到知识图谱。通过预设好的模型从多数据源中抽取数据,由于采用的模型为网络安全数据模型,使得网络数据的安全特征对实体数据以及属性和关系数据及其属性进行提取,以提高获取到的实体数据和关系数据的有效性和可靠性,提高了知识图谱的准确性。本申请还公开了一种知识图谱构建装置、知识图谱构建系统以及计算机可读存储介质,具有以上有益效果。具有以上有益效果。具有以上有益效果。

【技术实现步骤摘要】
一种知识图谱构建方法及相关装置


[0001]本申请涉及安全数据处理领域,特别涉及一种知识图谱构建方法、知识图谱构建装置、知识图谱构建系统以及计算机可读存储介质。

技术介绍

[0002]随着信息技术的不断发展,网络安全问题越来越受到重视。为了提前避免出现安全问题,提高系统的安全保障,可以从网络数据中提前发现新的威胁或安全知识。
[0003]相关技术中,通常采用预设规则的方式对网络数据进行匹配,以便从网络数据中发现相关的威胁数据或者是安全知识。还可以对网络数据构建安全知识图谱,以便从安全知识图谱中发现新的威胁或安全知识。但是,由于网络数据的复杂性和多样性,导致基于网络数据构建出的知识图谱没有办法符合实际的网络安全场景,导致无法从知识图谱中分析出有效的网络安全知识,降低了知识图谱的准确性和有效性。
[0004]因此,如何提高构建知识图谱的准确性和有效性是本领域技术人员关注的重点问题。

技术实现思路

[0005]本申请的目的是提供一种知识图谱构建方法、知识图谱构建装置、知识图谱构建系统以及计算机可读存储介质,以提高构建出的知识图谱的准确性和有效性。
[0006]为解决上述技术问题,本申请提供一种知识图谱构建方法,包括:
[0007]基于网络安全数据模型从数据源进行数据提取,获得实体数据和关系数据;其中,所述网络安全数据模型为根据网络数据的安全特征构建的针对于实体类型、关系类型以及属性信息的数据模型;
[0008]采用所述实体数据和所述关系数据进行知识图谱构建,得到知识图谱。
[0009]可选的,基于网络安全数据模型从数据源进行数据提取,获得实体数据和关系数据,包括:
[0010]基于多数据源获取多源异构数据;
[0011]基于所述网络安全数据模型的实体类型与关系类型对所述多源异构数据进行类型匹配,得到初始实体数据和初始关系数据;
[0012]基于所述实体类型对应的属性信息对所述初始实体数据的属性进行融合,得到所述实体数据;
[0013]基于所述关系类型对应的属性信息对所述初始关系数据的属性进行融合,得到所述关系数据。
[0014]可选的,基于多数据源获取多源异构数据,包括:
[0015]从安全数据库获取威胁情报数据;
[0016]在沙盒环境执行可执行文件,并记录行为数据得到沙盒执行数据;
[0017]从归属信息查询平台进行查询,得到网络安全信息数据;
[0018]将所述威胁情报数据、所述沙盒执行数据以及所述网络安全信息数据作为所述多源异构数据。
[0019]可选的,基于所述网络安全数据模型的实体类型与关系类型对所述多源异构数据进行类型匹配,得到初始实体数据和初始关系数据,包括:
[0020]从所述威胁情报数据中提取类型为域名、URL、File以及IP的数据,作为所述初始实体数据;
[0021]从所述沙盒执行数据和所述网络安全信息数据中提取所述初始实体数据之间的符合关系类型的数据,得到所述初始关系数据。
[0022]可选的,在分别对所述初始实体数据的属性和初始关系数据的属性进行融合之前,还包括:
[0023]基于实体定义信息逐一判断所述初始实体数据中的实体描述信息是否合法;
[0024]若否,将所述实体描述信息从所述初始实体数据中剔除,并将所述实体描述信息对应的关系描述信息从所述初始关系数据中剔除。
[0025]可选的,基于所述实体类型对应的属性信息对所述初始实体数据的属性进行融合,得到所述实体数据,包括:
[0026]将所述初始实体数据中相同的实体进行融合,得到已融合的实体数据;
[0027]基于所述实体类型对应的属性信息确定所述已融合的实体数据的空缺属性和冗余属性;
[0028]将所述已融合的实体数据中的所述冗余属性进行剔除,对所述空缺属性进行查询,并基于查询结果对所述已融合的实体数据进行补充,得到所述实体数据。
[0029]可选的,采用所述实体数据和所述关系数据进行知识图谱构建,得到知识图谱,包括:
[0030]将所述实体数据和所述关系数据写入图数据库,得到所述知识图谱。
[0031]本申请还提供一种知识图谱构建装置,包括:
[0032]实体关系数据获取模块,用于基于网络安全数据模型从数据源进行数据提取,获得实体数据和关系数据;其中,所述网络安全数据模型为根据网络数据的安全特征构建的针对于实体类型、关系类型以及属性信息的数据模型;
[0033]知识图谱构建模块,用于采用所述实体数据和所述关系数据进行知识图谱构建,得到知识图谱。
[0034]本申请还提供一种知识图谱构建系统,包括:
[0035]存储器,用于存储计算机程序;
[0036]处理器,用于执行所述计算机程序时实现如上所述的知识图谱构建方法的步骤。
[0037]本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的知识图谱构建方法的步骤。
[0038]本申请所提供的一种知识图谱构建方法,包括:基于网络安全数据模型从数据源进行数据提取,获得实体数据和关系数据;其中,所述网络安全数据模型为根据网络数据的安全特征构建的针对于实体类型、关系类型以及属性信息的数据模型;采用所述实体数据和所述关系数据进行知识图谱构建,得到知识图谱。
[0039]通过预设好的模型从多数据源中抽取数据,由于采用的模型为网络安全数据模
型,使得网络数据的安全特征对实体数据以及属性和关系数据及其属性进行提取,以提高获取到的实体数据和关系数据的有效性和可靠性,进而再采用该实体数据和关系数据进行知识图谱构建,得到有效的知识图谱,提高对网络数据进行分析的有效性,提高了知识图谱的准确性。
[0040]本申请还提供一种知识图谱构建装置、知识图谱构建系统以及计算机可读存储介质,具有以上有益效果,在此不做赘述。
附图说明
[0041]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0042]图1为本申请实施例所提供的一种知识图谱构建方法的流程图;
[0043]图2为本申请实施例所提供的一种知识图谱构建方法的知识图谱示意图;
[0044]图3为本申请实施例所提供的一种知识图谱构建方法中数据提取流程的流程图;
[0045]图4为本申请实施例所提供的一种知识图谱构建装置的结构示意图;
[0046]图5为本申请实施例所提供的一种知识图谱构建系统的结构示意图。
具体实施方式
[0047]本申请的核心是提供一种知识图谱构建方法、知识图谱构建装置、知识图谱构建系统以及计算机可读存储介质,以提高构建出的知识本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种知识图谱构建方法,其特征在于,包括:基于网络安全数据模型从数据源进行数据提取,获得实体数据和关系数据;其中,所述网络安全数据模型为根据网络数据的安全特征构建的针对于实体类型、关系类型以及属性信息的数据模型;采用所述实体数据和所述关系数据进行知识图谱构建,得到知识图谱。2.根据权利要求1所述的知识图谱构建方法,其特征在于,基于网络安全数据模型从数据源进行数据提取,获得实体数据和关系数据,包括:基于多数据源获取多源异构数据;基于所述网络安全数据模型的实体类型与关系类型对所述多源异构数据进行类型匹配,得到初始实体数据和初始关系数据;基于所述实体类型对应的属性信息对所述初始实体数据的属性进行融合,得到所述实体数据;基于所述关系类型对应的属性信息对所述初始关系数据的属性进行融合,得到所述关系数据。3.根据权利要求2所述的知识图谱构建方法,其特征在于,基于多数据源获取多源异构数据,包括:从安全数据库获取威胁情报数据;在沙盒环境执行可执行文件,并记录行为数据得到沙盒执行数据;从归属信息查询平台进行查询,得到网络安全信息数据;将所述威胁情报数据、所述沙盒执行数据以及所述网络安全信息数据作为所述多源异构数据。4.根据权利要求3所述的知识图谱构建方法,其特征在于,基于所述网络安全数据模型的实体类型与关系类型对所述多源异构数据进行类型匹配,得到初始实体数据和初始关系数据,包括:从所述威胁情报数据中提取类型为域名、URL、File以及IP的数据,作为所述初始实体数据;从所述沙盒执行数据和所述网络安全信息数据中提取所述初始实体数据之间的符合关系类型的数据,得到所述初始关系数据。5.根据权利要求2所述的知识图谱构建方法,其特征在于,在分别对所述初始实体数据的属性和初始关系数据的属性进...

【专利技术属性】
技术研发人员:朱广飞刘俊谢志荣
申请(专利权)人:深信服科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1