【技术实现步骤摘要】
内容查找方法、装置、电子设备及计算机可读介质及产品
[0001]本申请涉及知识图谱
,更具体地,涉及一种内容查找方法、装置、电子设备及计算机可读介质及产品。
技术介绍
[0002]目前,知识图谱在许多领域都有重要应用,实体链接是应用知识图谱进行信息查询的重要环节之一。当需要确定一个指定内容对应的实体时,需要从别名词库中召回所有该指定内容对应的候选实体。然而,该方法会导致漏召回,且实体链接的准确率不高。
技术实现思路
[0003]本申请提出了一种内容查找方法、装置、电子设备及计算机可读介质及产品。
[0004]第一方面,本申请实施例提供了一种内容查找方法,所述方法包括:获取与待链接实体匹配的多个召回实体;基于所述待链接实体与每个召回实体对应的实体信息的匹配结果,确定每个召回实体的评分值,所述实体信息包括实体名称、实体别名和实体描述的至少一种;查找评分值大于指定阈值的召回实体,作为候选实体;基于所述候选实体确定所述待链接实体对应的目标实体。
[0005]第二方面,本申请实施例还提供了一种内容查找装置,所述装置包括:第一查找单元、第一处理单元、第二查找单元以及第二处理单元。其中,第一查找单元,用于获取与待链接实体匹配的多个召回实体;第一处理单元,用于基于所述待链接实体与每个召回实体对应的实体信息的匹配结果,确定每个召回实体的评分值,所述实体信息包括实体名称、实体别名和实体描述的至少一种;第二查找单元,用于查找评分值大于指定阈值的召回实体,作为候选实体;第二处理单元,基于所述候选实体确定 ...
【技术保护点】
【技术特征摘要】
1.一种内容查找方法,其特征在于,包括:获取与待链接实体匹配的多个召回实体;基于所述待链接实体与每个召回实体对应的实体信息的匹配结果,确定每个召回实体的评分值,所述实体信息包括实体名称、实体别名和实体描述的至少一种;查找评分值大于指定阈值的召回实体,作为候选实体;基于所述候选实体确定所述待链接实体对应的目标实体。2.根据权利要求1所述的方法,其特征在于,所述基于所述待链接实体与每个召回实体对应的实体信息的匹配结果,确定每个召回实体的评分值,包括:从多个召回实体中确定一个目标召回实体;基于所述目标召回实体对应的权重和搜索评分,确定所述目标召回实体对应的评分值,其中,所述搜索评分用于表征所述目标召回实体与所述待链接实体之间的相关度,所述权重基于所述待链接实体与所述目标召回实体对应的实体信息的匹配结果而确定;从多个召回实体中,确定新的目标召回实体,并返回执行基于所述目标召回实体对应的权重和搜索评分,确定所述目标召回实体对应的评分值的操作,直至所有召回实体遍历完毕。3.根据权利要求2所述的方法,其特征在于,所述实体信息包括第一信息和第二信息,所述第一信息为实体名称、实体别名和实体描述的其中一个,所述第二信息为实体名称、实体别名和实体描述三者中除第一信息之外的二者的其中之一,所述基于所述目标召回实体对应的权重和搜索评分,确定所述目标召回实体对应的评分值,包括:确定待链接实体与目标召回实体的实体信息的匹配结果;若所述匹配结果为待链接实体与目标召回实体对应的所述第一信息匹配,基于第一权重和搜索评分确定所述目标召回实体对应的评分值;若所述匹配结果为待链接实体与目标召回实体对应的所述第二信息匹配,基于第二权重和搜索评分确定所述目标召回实体对应的评分值。4.根据权利要求3所述的方法,其特征在于,所述第一信息为实体名称,第二信息为实体别名,所述第一权重大于所述第二权重。5.根据权利要求3所述的方法,其特征在于,所述第一信息为实体别名,第二信息为实体描述,所述第一权重大于所述第二权重。6.根据权利要求3所述的方法,其特征在于,所述第一信息为实体名称,第二信息为实体描述,所述第一权重大于所述第二权重。7.根据权利要求2所述的方法,其特征在于,所述实体信息包括实体名称、实体别名和实体描述,所述基于所述目标召回实体对应的权重和搜索评分,确定所述目标召回实体对应的评分值,包括:确定待链接实体与目标召回实体的实体信息的匹配结果;若所述匹配结果为待链接实体与目标召回实体对应的所述实体名称匹配,基于第一权重和搜索评分确定所述目标召回实体对应的评分值;若所述匹配结果为待链接实体与目标召回实体对应的所述实体别名匹配,基于第二权重和搜索评分确定所述目标召回实体对应的评分值;若所述匹配结果为待链接实体与目标召回实体对应的所述实体描述匹配,基于第三...
【专利技术属性】
技术研发人员:樊乘源,刘海锋,
申请(专利权)人:广东明创软件科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。