【技术实现步骤摘要】
知识图谱的更新方法、装置、设备及存储介质
[0001]本申请涉及计算机网络安全
,尤其涉及一种知识图谱的更新方法、装置、设备及存储介质。
技术介绍
[0002]网络威胁情报是关于IT或信息资产所面临的现有或潜在威胁的循证知识,包括情境、机制、指标、推论与可行建议,这些知识可为威胁响应提供决策依据。在实际应用中,通过信息抽取技术,将海量的、非结构化的威胁情报信息转化为结构化的信息,并构建网络安全知识图谱,以此作为攻击检测、攻击画像等任务的基础。
[0003]但是目前的网络威胁情报数据呈现体量大、来源广、更新快的特点,导致信息抽取系统抽取出的新知识存在大量的冗余、不一致性问题,例如知识重复出现、实体标签不唯一、实体关系不确定等,导致构建出的知识图谱整体的质量低下。
技术实现思路
[0004]本申请的主要目的在于提供一种知识图谱的更新方法、装置、设备及存储介质,旨在解决现有技术中知识图谱整体的质量低下的技术问题。
[0005]为实现以上目的,本申请提供一种知识图谱的更新方法,所述知识图谱的更新 ...
【技术保护点】
【技术特征摘要】
1.一种知识图谱的更新方法,其特征在于,所述知识图谱的更新方法包括:获取证据存储引擎和待更新知识,其中,所述证据存储引擎包括初始知识、所述初始知识的证据和所述初始知识的证据的信息源;基于所述初始知识、所述初始知识的证据和所述初始知识的证据的信息源,判断所述待更新知识是否满足预设可信度阈值范围指示的质量标准;若所述待更新知识满足所述质量标准,则将所述待更新知识更新至所述证据存储引擎和目标知识图谱。2.如权利要求1所述的知识图谱的更新方法,其特征在于,所述基于所述初始知识、所述初始知识的证据和所述初始知识的证据的信息源,判断所述待更新知识是否满足预设可信度阈值范围指示的质量标准的步骤,包括:基于所述初始知识,从所述证据存储引擎中选取预设数量的所述待更新知识的参考知识;基于所述初始知识的证据和所述初始知识的证据的信息源,确定所述参考知识的证据和所述参考知识的证据的信息源,并基于所述参考知识、所述参考知识的证据和所述参考知识的证据的信息源,计算所述待更新知识的第一验证概率;基于所述第一验证概率,判断所述待更新知识是否满足预设可信度阈值范围指示的质量标准。3.如权利要求2所述的知识图谱的更新方法,其特征在于,所述基于所述参考知识、所述参考知识的证据和所述参考知识的证据的信息源,计算所述待更新知识的第一验证概率的步骤,包括:确定所述参考知识的证据的信息源的可信度;基于所述参考知识的证据和所述参考知识的证据的信息源的可信度,对每一所述参考知识进行验证概率计算,得到每一所述参考知识的第二验证概率,其中,验证概率计算公式如下:其中,t表示参考知识,E
t
是参考知识的证据集合,E是初始知识的证据集合,是证据的信息源的可信度,|
·
|表示集合大小,P(t)表示第二验证概率;将所述每一所述参考知识的第二验证概率进行加权和计算,得到所述待更新知识的第一验证概率,其中,加权和计算公式如下:其中,t
c
表示待更新知识的证据,P(t
c
)表示待更新知识的第一验证概率。4.如权利要求2所述的知识图谱的更新方法,其特征在于,所述从所述证据存储引擎中选取预设数量的所述待更新知识的参考知识的步骤,包括:确定所述待更新知识的第一属性信息和所述初始知识的第二属性信息,其中,所述属性信息包括实体、关系和标签;
基于所述第一属性信息和所述第二属性信息,将每一所述初始知识与所述待更新知识进行相似度计算,得到相似度结果,其中,相似度计算公式如下:其中,t表示知识,sim(t
i
,t
j
)表示任意两个知识的相似度,sub、pre和obj分别表示知识的实体、关系和标签,表示任意两个实体向量的余弦相似度,...
【专利技术属性】
技术研发人员:顾钊铨,张欢,贾焰,方滨兴,张钧建,谭昊,周可,罗翠,袁华平,
申请(专利权)人:鹏城实验室,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。