【技术实现步骤摘要】
知识图谱的处理方法、装置、设备和介质
本专利技术实施例涉及智能物流
,尤其涉及一种知识图谱的处理方法、装置、设备和介质。
技术介绍
构建一个权威准确全面的医疗行业知识图谱是许多上层应用的基础数据需求,权威医疗书籍中的医疗知识是人们总结及论证过的智慧结晶,从中人们可以挖掘出许多权威的医疗事实。现有的技术想要把从医疗书籍中挖掘的医疗事实,准确地加入到医疗图谱中,一般的方法是通过事实的频率信息进行初步筛选,然后再经过医学专家审核。此种方法因为是人力介入,存在着人力投入大、效率相对较低的问题。而医学专家审核医学事实的过程,除了依靠经验,很多情况下也需要有一个书籍查询工具进行查询印证。
技术实现思路
本专利技术实施例提供一种知识图谱的处理方法、装置、设备和介质,以解决现有技术在构建知识图谱时人力投入大、效率相对较低的问题。第一方面,本专利技术实施例提供了一种知识图谱的处理方法,所述方法包括:根据待验证知识图谱,从待验证知识图谱所属目标领域的实体证据单元中选择至少两个候选实体证据单元;确定所述待检验知识图谱与所述至少两个候选实体证据单元的匹配度;根据所述匹配度,从所述至少两个候选实体证据单元中选择所述待检验知识图谱的目标实体证据单元,供基于所述目标实体证据单元对所述待验证知识图谱进行验证。第二方面,本专利技术实施例提供了一种知识图谱的处理装置,所述装置包括:候选实体证据单元选择模块,用于根据待验证知识图谱,从待验证知识图谱所属目标领域的实体证据单元中选择至少两个候选实体证据单元;匹配度确定模块,用于确定所述待检验知识图谱与所述至少两个候选实体证据单元的匹配度;目标实 ...
【技术保护点】
1.一种知识图谱的处理方法,其特征在于,所述方法包括:根据待验证知识图谱,从待验证知识图谱所属目标领域的实体证据单元中选择至少两个候选实体证据单元;确定所述待检验知识图谱与所述至少两个候选实体证据单元的匹配度;根据所述匹配度,从所述至少两个候选实体证据单元中选择所述待检验知识图谱的目标实体证据单元,供基于所述目标实体证据单元对所述待验证知识图谱进行验证。
【技术特征摘要】
1.一种知识图谱的处理方法,其特征在于,所述方法包括:根据待验证知识图谱,从待验证知识图谱所属目标领域的实体证据单元中选择至少两个候选实体证据单元;确定所述待检验知识图谱与所述至少两个候选实体证据单元的匹配度;根据所述匹配度,从所述至少两个候选实体证据单元中选择所述待检验知识图谱的目标实体证据单元,供基于所述目标实体证据单元对所述待验证知识图谱进行验证。2.根据权利要求1所述的方法,其特征在于,根据待验证知识图谱,从待验证知识图谱所属目标领域的实体证据单元中选择至少两个候选实体证据单元之前,还包括:从目标领域事实中提取属性信息和属性信息所属的章节标题信息;将所述章节标题信息作为目标领域中实体证据单元的标题;将所述属性信息中的属性名称作为目标领域中实体证据单元的属性关键字;将所述属性信息中的属性内容作为目标领域中实体证据单元的属性键值。3.根据权利要求1所述的方法,其特征在于,根据待验证知识图谱,从待验证知识图谱所属目标领域的实体证据单元中选择至少两个候选实体证据单元,包括:将待验证知识图谱中的实体名作为搜索词,在目标领域的实体证据单元的章节标题信息、属性关键字和属性键值中进行搜索,得到第一实体证据单元;将待验证知识图谱中的属性值作为搜索词,在目标领域的实体证据单元的属性键值中进行搜索,得到第二实体证据单元;从所述第一实体证据单元和所述第二实体证据单元中选择至少两个候选实体证据单元。4.根据权利要求3所述的方法,其特征在于,从所述第一实体证据单元和所述第二实体证据单元中选择至少两个候选实体证据单元之后,还包括:根据知识图谱中属性名与实体证据单元中属性关键字之间的映射关系,以及待验证知识图谱,从所述至少两个候选实体证据单元中选择与所述待验证知识图谱匹配的候选实体证据单元,且滤除其他候选实体证据单元。5.根据权利要求1所述的方法,其特征在于,确定所述待检验知识图谱与所述至少两个候选实体证据单元的匹配度,包括:确定待检验知识图谱中的实体名,与候选实体证据单元中的标题之间的标题相似度;确定待检验知识图谱中的属性值,与候选实体证据单元中的属性键值之间的键值相似度;根据所述候选实体证据单元的标题相似度和键值相似度,确定候选实体证据单元的匹配度。6.根据权利要求5所述的方法,其特征在于,确定待检验知识图谱中的实体名,与候选实体证据单元中的标题之间的标题相似度,包括:将所述待检验知识图谱中的实体名与候选实体证据单元中的标题,作为预测模型的输入,得到第一标题相似度;根据所述待检验知识图谱的实体名与候选实体证据单元的标题之间的文本重合关系,确定第二标题相似度。7.根据权利要求5所述的方法,其特征在于,确定待检验知识图谱中的属性值,与候选实体证据单元中的属性键值之间的键值相似度,包括:将所述待检验知识图谱中的属性值与候选实体证据单元中的属性键值,作为预测模型的输入,得到第一键值相似度;根据所述待检验知识图谱的属性值与候选实体证据单元的属性键值之间的文本重合关系,确定第二键值相似度。8.根据权...
【专利技术属性】
技术研发人员:林义明,郭辉,徐伟建,纪登林,罗雨,彭卫华,史亚冰,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。