【技术实现步骤摘要】
知识图谱中实体关系的检测方法、装置和电子设备
[0001]本申请涉及计算机
,具体涉及一种知识图谱中实体关系的检测方法、装置和电子设备。
技术介绍
[0002]知识图谱以结构化的方式描述客观世界中的概念、实体及其键的关系,提供了一种更好的组织、管理和理解互联网海量信息的能力。错误检测是知识图谱应用研究的主要内容之一,在机器人、智能问答、信息检索等领域有着广阔的应用前景。因此,对其进行研究具有重要意义。然而,现有技术对知识图谱进行错误检测的方案,在检测过程中,正确率较低,检测效果较差。
技术实现思路
[0003]本申请实施例提供一种知识图谱中实体关系的检测方法、装置、电子设备和存储介质,可以有效地提高知识图谱中实体关系检测的准确性。
[0004]本申请实施例提供一种知识图谱中实体关系的检测方法,包括:
[0005]获取待检测知识图谱中至少一个实体对,每个实体对包括在目标属性上存在链接关系的第一实体和第二实体;
[0006]将所有实体对中第一实体的实体信息进行倒排,得到倒排索引列表; ...
【技术保护点】
【技术特征摘要】
1.一种知识图谱中实体关系的检测方法,其特征在于,包括:获取待检测知识图谱中至少一个实体对,每个实体对包括在目标属性上存在链接关系的第一实体和第二实体;将所有实体对中第一实体的实体信息进行倒排,得到倒排索引列表;分别对每个第二实体的实体信息进行语义分析,得到每个第二实体对应的查询信息;基于所述倒排索引列表和所述查询信息,计算每个实体对中第一实体与第二实体之间的第一相似度;将所述第一相似度满足第一预设条件的实体对确定为所述待检测知识图谱中在目标属性上链接关系正确的实体对。2.根据权利要求1所述的方法,其特征在于,所述将所述第一相似度满足第一预设条件的实体对确定为所述待检测知识图谱中在目标属性上链接关系正确的实体对之后,还包括:将链接关系正确的实体对中的第一实体确定为目标第一实体,将与目标第一实体链接于同一第二实体的其他第一实体确定为候选第一实体;对所述目标第一实体的实体信息进行语义分析,得到所述目标第一实体对应的目标查询信息;基于所述目标查询信息和候选第一实体的实体信息,计算所述目标第一实体和候选第一实体之间的第二相似度;若所述第二相似度满足第二预设条件,则将所述候选第一实体,以及与目标第一实体链接的第二实体确定为所述待检测知识图谱中在目标属性上链接关系正确的实体对。3.根据权利要求2所述的方法,其特征在于,所述若所述第二相似度满足第二预设条件,则将所述候选第一实体,以及与目标第一实体链接的第二实体确定为所述待检测知识图谱中在目标属性上链接关系正确的实体对之后,还包括:当所有候选第一实体计算完成时,将所述待检测知识图谱中所有在目标属性上链接关系正确的实体对添加到实体对集合中;若在目标属性上存在链接关系的实体对不在所述实体对集合中,则将不在所述实体对集合中的实体对确定为所述待检测知识图谱中在目标属性上链接关系错误的实体对。4.根据权利要求1所述的方法,其特征在于,所述将所有实体对中第一实体的实体信息进行倒排,得到倒排索引列表,包括:将所有实体对中第一实体的实体信息进行分词,得到第一词集合;对所述第一词集合进行去重,得到去重后第一词集合;建立每个第一实体的实体信息与去重后第一词集合中每个词的映射关系,并基于所述映射关系生成倒排索引列表。5.根据权利要求1所述的方法,其特征在于,所述分别对每个第二实体的实体信息进行语义分析,得到每个第二实体对应的查询信息,包括:分别对每个第二实体的实体信息进行分词,得到每个第二实体对应的第二词集合;分别对各个第二词集合进行关键词抽取,得到每个第二实体对应的关键词集合;从每个关键词集合中筛选出预设数量的目标关键词,并将筛选出的目标关键词确定为相应第二实体对应的查询信息。
6.根据权利要求5所述的方法,其特征在于,所述分别对各个第二词集合进行关键词抽取,得到每个第二实体对应的关键词集合,包括:分别计算各个第二词集合中每个词的词频和每个词的逆文档频率;基于各个第二词集合中每个词的词频和逆文档频率,确定每个第二实体对应的关键词集合。7.根据权利要求1至6任一项所述的方法,其特征在于,所述分别对每个第二实体的实体信息进行语义分析,得到每个第二实体对应...
【专利技术属性】
技术研发人员:王安然,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。