The embodiment of the invention provides a method, apparatus and computing device for determining related entities, which includes: acquiring a target knowledge map with at least a target entity; determining a candidate entity set of the target entity in the target knowledge map; and the candidate entity set comprising: reachable. A candidate entity corresponding to the number of edges of the target entity is identified, and the related entity of the target entity is determined according to the set of candidate entities. The embodiment of the invention can enhance the recall rate of the related entities to determine the results.
【技术实现步骤摘要】
一种相关实体确定方法、装置及计算设备
本专利技术涉及数据处理
,具体涉及一种相关实体确定方法、装置及计算设备。
技术介绍
相关实体可以认为是在同一查询中与查询到的目标实体共现的其他实体,对于用户获取查询到的目标实体的相关信息具有重要意义;比如用户在输入查询语句后,搜索引擎除了将搜索到的与该查询语句对应的目标实体(比如网页链接)展现给用户外,还会将查询过程中与该目标实体共现的相关实体推荐给用户,以引导用户进行再次搜索,提升用户获得相关信息的便利性;一种典型的场景是,搜索引擎在搜索到与查询语句对应的目标实体后,除在搜索结果页面显示所搜索到的目标实体,还可在搜索结果页面的设定区域(比如左侧区域)显示所推荐的相关实体,以便用户再次搜索。本专利技术的专利技术人发现,目前主要是通过开放文本(比如新闻文本)来统计与一目标实体共现的其他实体,以确定一目标实体的相关实体;然而,开放文本录入的内容具有一定的局限性和时效性,这使得通过开放文本统计的相关实体确定结果不可控,导致相关实体确定结果的召回率较低(召回率表示确定的相关实体数量和相关实体总数量的比值,是确定结果全面性的一种体现)。
技术实现思路
有鉴于此,本专利技术实施例提供一种相关实体确定方法、装置及计算设备,以提升相关实体确定结果的召回率。为实现上述目的,本专利技术实施例提供如下技术方案:一种相关实体确定方法,包括:获取目标知识图谱,所述目标知识图谱至少具有目标实体;确定所述目标知识图谱中,所述目标实体的候选实体集合;所述候选实体集合包括:可触达所述目标实体的各边数对应的候选实体;根据所述候选实体集合,确定所述目标实 ...
【技术保护点】
1.一种相关实体确定方法,其特征在于,包括:获取目标知识图谱,所述目标知识图谱至少具有目标实体;确定所述目标知识图谱中,所述目标实体的候选实体集合;所述候选实体集合包括:可触达所述目标实体的各边数对应的候选实体;根据所述候选实体集合,确定所述目标实体的相关实体。
【技术特征摘要】
1.一种相关实体确定方法,其特征在于,包括:获取目标知识图谱,所述目标知识图谱至少具有目标实体;确定所述目标知识图谱中,所述目标实体的候选实体集合;所述候选实体集合包括:可触达所述目标实体的各边数对应的候选实体;根据所述候选实体集合,确定所述目标实体的相关实体。2.根据权利要求1所述的相关实体确定方法,其特征在于,所述获取目标知识图谱包括:获取输入文本,所述输入文本中预先给定有多个命名实体,所述命名实体至少包括所述目标实体;将输入文本中给定的命名实体,映射到知识图谱的目标实体上,得到目标知识图谱;所述知识图谱由包含目标实体的数据源构建。3.根据权利要求1或2所述的相关实体确定方法,其特征在于,所述确定所述目标知识图谱中,所述目标实体的候选实体集合包括:获取预设定的边数范围,所述边数范围包括多个边数;根据所述边数范围所包括的各边数,确定所述目标知识图谱中,可触达所述目标实体的各边数对应的候选实体,得到所述目标实体的候选实体集合。4.根据权利要求1所述的相关实体确定方法,其特征在于,所述根据所述候选实体集合,确定所述目标实体的相关实体包括:若所述候选实体集合中,存在对应不同边数的重复的候选实体,将所述候选实体集合中重复的候选实体进行去重处理,以保留重复的候选实体中边数最小的候选实体;将去重处理后的候选实体集合所包括的候选实体,作为所述目标实体的相关实体。5.根据权利要求4所述的相关实体确定方法,其特征在于,还包括:确定各相关实体的推荐排序,以根据各相关实体的推荐排序进行相关实体的推荐。6.根据权利要求5所述的相关实体确定方法,其特征在于,所述确定各相关实体的推荐排序包括:在开放文本中统计各相关实体与目标实体的相关程度分数;确定各相关实体在所述目标知识图谱中对应的权重分数;对于各相关实体,将相关实体对应的相关程度分数与权重分数相加,得到各相关实体对应的排序分数;根据各相关实体对应的排序分数,确定各相关实体的推荐排序,其中,排序分数越高,推荐排序越靠前。7.根据权利要求5所述的相关实体确定方法,其特征在于,所述确定各相关实体的推荐排序包括:在开放文本中统计各相关实体与目标实体的相关程度分数,根据各相关实体与目标实体的相关程度分数,确定各相关实体的推荐排序,其中,相关程分数度越高,推荐排序越靠前;或,确定各相关实体在所述目标知识图谱中对应的权重分数,根据各相关实体对应的权重分数,确定各相关实体的推荐排序,其中,权重分数越高,推荐排序越靠前。8.根据权利要求6或7所述的相关实体确定方法,其特征在于,所述确定各相关实体在所述目标知识图谱中对应的权重分数包括:以去重处理后的候选实体集合以及所述目标实体为范围,确定各相关实体可触达的最近实体;根据预设定的目标知识图谱中各关系相应的关系权重,确定各相关实体与可触达的最近实体的关系对应的关系权重,得到各相关实体对应的关系权重;对于各相关实体,将相关实体对应的边数的边数权重,与对应的关系权重相结合,得到各相关实体对应的权重分数;其中,边数越大,边数权重越小。9.根据权利要求6或7所述的相关实体确定方法,其特征在于,所述在开放文本中统计各相关实体与目标实体的相关程度分数包括:对于一相关实体,确定同时出现该相关实体和目标实体的文本数量与文本总数量的第一比值,出现该相关实体的文本...
【专利技术属性】
技术研发人员:李潇,张锋,王策,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。