图谱校验方法、装置和存储介质及电子设备制造方法及图纸

技术编号:39243721 阅读:20 留言:0更新日期:2023-10-30 11:56
本申请公开了一种图谱校验方法、装置和存储介质及电子设备。其中,该方法包括:获取第一文本信息库,其中,第一文信息本库中的文本信息属于目标知识领域;在已构建目标知识图谱的情况下,确定目标知识图谱中的各个知识实体与第一文本信息库中的文本信息之间的映射关系,其中,目标知识图谱为依据第二文本信息库中的文本信息构建得到的、用于表示目标知识领域下的各个知识实体之间关系的图数据结构,第二文本信息库中的文本信息属于目标知识领域;基于映射关系,利用第一文本信息库中的文本信息对目标知识图谱进行校验。本申请解决了图谱校验准确性较低的技术问题。准确性较低的技术问题。准确性较低的技术问题。

【技术实现步骤摘要】
图谱校验方法、装置和存储介质及电子设备


[0001]本申请涉及计算机领域,具体而言,涉及一种图谱校验方法、装置和存储介质及电子设备。

技术介绍

[0002]在图谱校验场景中,通常会利用知识图谱进行循证医学,但是由于医学图谱自身在构建完成后也需要进行校验,以确保医学知识图谱中的信息不出现纰漏,通常采用构建知识图谱的文本信息作为循证依据,但是当文本信息自身出现错误,则验证结果天然存在问题,进而导致图谱校验准确率较低的问题出现。因此,存在图谱校验准确率较低的问题。
[0003]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0004]本申请实施例提供了一种图谱校验方法、装置和存储介质及电子设备,以至少解决图谱校验效率较低的技术问题。
[0005]根据本申请实施例的一个方面,提供了一种图谱校验方法,包括:
[0006]获取第一文本信息库,其中,上述第一文信息本库中的文本信息属于目标知识领域;
[0007]在已构建目标知识图谱的情况下,确定上述目标知识图谱中的各个知识实体与上述第一文本信息库中本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种图谱校验方法,其特征在于,包括:获取第一文本信息库,其中,所述第一文信息本库中的文本信息属于目标知识领域;在已构建目标知识图谱的情况下,确定所述目标知识图谱中的各个知识实体与所述第一文本信息库中的文本信息之间的映射关系,其中,所述目标知识图谱为依据第二文本信息库中的文本信息构建得到的、用于表示所述目标知识领域下的各个知识实体之间关系的图数据结构,所述第二文本信息库中的文本信息属于所述目标知识领域;基于所述映射关系,利用所述第一文本信息库中的文本信息对所述目标知识图谱进行校验。2.根据权利要求1所述的方法,其特征在于,所述获取第一文本信息库,包括:获取所述目标知识领域下的至少两类文本信息,其中,所述至少两类文本信息中的各类文本信息对应的信息格式不同;对所述至少两类文本信息进行聚合处理,得到目标格式的文本信息;将所述目标格式的文本信息存入第一初始信息库,得到所述第一文本信息库。3.根据权利要求2所述的方法,其特征在于,所述获取所述目标知识领域下的至少两类文本信息,包括:获取所述目标知识领域下的多个文本信息;将所述多个文本信息中信息格式为所述目标格式的文本信息进行过滤,得到剩余文本信息,其中,所述至少两类文本信息包括所述剩余文本信息,所述第二文本信息库中的文本信息对应的信息格式为所述目标格式。4.根据权利要求2所述的方法,其特征在于,在所述获取第一文本信息库之前,所述方法还包括:获取所述目标知识领域下的、信息格式为所述目标格式的目标文本信息;将所述目标文本信息存入第二初始信息库,得到所述第二文本信息库。5.根据权利要求1所述的方法,其特征在于,所述获取第一文本信息库,包括:获取第三初始信息库;利用所述目标知识图谱中的知识实体对所述第三初始信息库进行信息补充,得到所述第一文本信息库。6.根据权利要求5所述的方法,其特征在于,所述利用所述目标知识图谱中的知识实体对所述第二初始信息库进行信息补充,得到所述第一文本信息库,包括:获取所述目标知识图谱中的长尾知识实体;在第三文本信息库中查找所述长尾知识实体对应的文本信息,其中,所述第三文本信息库中的文本信息量大于所述第一文本信息库中的文本信息量;将所述长尾知识实体对应的文本信息存入所述第二初始信息库,得到所述第一文本信息库。7.根据权利要求1所述的方法,其特征在于,所述基于所述映射关系,利用所述第一文本信息库中的文本信息对所述目标知识图谱进行校验,包括:获取所述目标知识图谱中的各条三元组,其中,所述三元组包含有至少两个知识实体、以及所述至少两个知识实体之间的实体关系;基于所述映射关系,利用所述第一文本信息库中的文本信息对所述各条三元组进行校
验。8.根据权利要求7所述的方法,其特征在于,所述基于所述映射关系,利用所述第一文本信息库中的文本信息对所述各条三元组进行校验,包括:执行以下步骤,直至所述各条三元组都已进行校验:从所述各条三元组中确定出当前三元组,其中,所述当前三元组包含有至少两个当前知识实体、以及所述至少两个当前知识实体之间的当前实体关系;从所述第一文本信息库中的文本信息中确定出与所述当前知识...

【专利技术属性】
技术研发人员:张子恒林镇溪吴贤
申请(专利权)人:腾讯云计算长沙有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1