内容查找方法、装置、电子设备及计算机可读介质及产品制造方法及图纸

技术编号:32971816 阅读:15 留言:0更新日期:2022-04-09 11:40
本申请公开了一种内容查找方法、装置、电子设备及计算机可读介质及产品,涉及知识图谱技术领域,所述方法包括:获取与待链接实体匹配的多个召回实体;基于所述待链接实体与每个召回实体对应的实体信息的匹配结果,确定每个召回实体的评分值,所述实体信息包括实体名称、实体别名和实体描述的至少一种;查找评分值大于指定阈值的召回实体,作为候选实体;基于所述候选实体获得输出内容。于所述候选实体获得输出内容。于所述候选实体获得输出内容。

【技术实现步骤摘要】
内容查找方法、装置、电子设备及计算机可读介质及产品


[0001]本申请涉及知识图谱
,更具体地,涉及一种内容查找方法、装置、电子设备及计算机可读介质及产品。

技术介绍

[0002]目前,知识图谱在许多领域都有重要应用,实体链接是应用知识图谱进行信息查询的重要环节之一。当需要确定一个指定内容对应的实体时,需要从别名词库中召回所有该指定内容对应的候选实体。然而,该方法会导致漏召回,且实体链接的准确率不高。

技术实现思路

[0003]本申请提出了一种内容查找方法、装置、电子设备及计算机可读介质及产品。
[0004]第一方面,本申请实施例提供了一种内容查找方法,所述方法包括:获取与待链接实体匹配的多个召回实体;基于所述待链接实体与每个召回实体对应的实体信息的匹配结果,确定每个召回实体的评分值,所述实体信息包括实体名称、实体别名和实体描述的至少一种;查找评分值大于指定阈值的召回实体,作为候选实体;基于所述候选实体确定所述待链接实体对应的目标实体。
[0005]第二方面,本申请实施例还提供了一种内容查找装置,所述装置包括:第一查找单元、第一处理单元、第二查找单元以及第二处理单元。其中,第一查找单元,用于获取与待链接实体匹配的多个召回实体;第一处理单元,用于基于所述待链接实体与每个召回实体对应的实体信息的匹配结果,确定每个召回实体的评分值,所述实体信息包括实体名称、实体别名和实体描述的至少一种;第二查找单元,用于查找评分值大于指定阈值的召回实体,作为候选实体;第二处理单元,基于所述候选实体确定所述待链接实体对应的目标实体。
[0006]第三方面,本申请实施例还提供了一种电子设备,包括:一个或多个处理器;存储器;一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个应用程序配置用于执行上述方法。
[0007]第四方面,本申请实施例还提供了一种计算机可读介质,所述可读存储介质存储有处理器可执行的程序代码,所述程序代码被所述处理器执行时使所述处理器执行上述方法。
[0008]第五方面,本申请实施例还提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现上述方法。
[0009]本申请提供的内容查找方法、装置、电子设备及计算机可读介质及产品,该方法首先获取与待链接实体匹配的多个召回实体;然后基于所述待链接实体与每个召回实体对应的实体信息的匹配结果,确定每个召回实体的评分值,再查找评分值大于指定阈值的召回实体,作为候选实体;基于所述候选实体确定所述待链接实体对应的目标实体。若将所有匹配到的召回实体都作为候选实体,将会导致基于所述候选实体确定所述待链接实体对应的目标实体的效率降低,通过确定每个召回实体的评分值,仅将评分值大于指定阈值的召回
实体,作为候选实体,可以提高基于所述候选实体确定所述待链接实体对应的目标实体的效率,还可以提高候选实体召回的准确率。
[0010]本申请实施例的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例而了解。本申请实施例的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
[0011]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0012]图1示出了本申请一实施例提供的内容查找方法应用的场景图;
[0013]图2示出了本申请实施例提供的内容查找方法的方法流程图;
[0014]图3示出了本申请实施例提供的内容查找方法的示意图;
[0015]图4示出了本申请又一实施例提供的内容查找方法的方法流程图;
[0016]图5示出了本申请再一实施例提供的内容查找方法的方法流程图;
[0017]图6示出了本申请还一实施例提供的内容查找方法的方法流程图;
[0018]图7示出了图6中步骤S630的一种实施方式;
[0019]图8示出了本申请还一实施例提供的内容查找方法的方法流程图;
[0020]图9示出了本申请还一实施例提供的内容查找方法的方法流程图;
[0021]图10示出了图9中步骤S950的一种实施方式;
[0022]图11示出了本申请还一实施例提供的内容查找方法的示意图;
[0023]图12示出了本申请实施例提供的内容查找装置的单元框图;
[0024]图13示出了本申请实施例提供的电子设备的示意图;
[0025]图14示出了本申请实施例提供的计算机可读存储介质的结构框图;
[0026]图15示出了本申请实施例提供的计算机程序产品的结构框图。
具体实施方式
[0027]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0028]应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0029]随着网络数据以指数级别增长,网络已经成为最大的数据仓库之一,且大量的数
据在网络上以自然语言的形式呈现。但是自然语言本身具有歧义性,尤其是对于一些出现频率较高的实体,它们可能对应多个名称,而每个名称又可能对应多个同名实体。因此,为了能够将网络数据与知识库连接起来,进而为理解网络数据的语义信息提供便利,需要使用的关键技术便是实体链接(entity linking)技术。
[0030]具体的,实体链接就是将一段文本中的某些字符串映射到知识库中对应的实体上。比如对于文本“郑雯出任复旦大学新闻学院副院长”,就可以将字符串“郑雯”、“复旦大学”、“复旦大学新闻学院”分别映射到对应的实体上。实体链接可以解决实体的歧义现象,实体的歧义现象包括多样性和歧义性两类,实体的多样性指的是某个实体实际上可能对应多个不同的别名,例如,“姚明”的别名包括移动长城、小巨人等,实体的歧义性指的是同一个实体在不同的上下文中可能对应着知识库中不一样的实体对象,例如,“李娜”可能对应着知识库中的运动员李娜、歌手李娜以及教师李娜等。
[0031]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种内容查找方法,其特征在于,包括:获取与待链接实体匹配的多个召回实体;基于所述待链接实体与每个召回实体对应的实体信息的匹配结果,确定每个召回实体的评分值,所述实体信息包括实体名称、实体别名和实体描述的至少一种;查找评分值大于指定阈值的召回实体,作为候选实体;基于所述候选实体确定所述待链接实体对应的目标实体。2.根据权利要求1所述的方法,其特征在于,所述基于所述待链接实体与每个召回实体对应的实体信息的匹配结果,确定每个召回实体的评分值,包括:从多个召回实体中确定一个目标召回实体;基于所述目标召回实体对应的权重和搜索评分,确定所述目标召回实体对应的评分值,其中,所述搜索评分用于表征所述目标召回实体与所述待链接实体之间的相关度,所述权重基于所述待链接实体与所述目标召回实体对应的实体信息的匹配结果而确定;从多个召回实体中,确定新的目标召回实体,并返回执行基于所述目标召回实体对应的权重和搜索评分,确定所述目标召回实体对应的评分值的操作,直至所有召回实体遍历完毕。3.根据权利要求2所述的方法,其特征在于,所述实体信息包括第一信息和第二信息,所述第一信息为实体名称、实体别名和实体描述的其中一个,所述第二信息为实体名称、实体别名和实体描述三者中除第一信息之外的二者的其中之一,所述基于所述目标召回实体对应的权重和搜索评分,确定所述目标召回实体对应的评分值,包括:确定待链接实体与目标召回实体的实体信息的匹配结果;若所述匹配结果为待链接实体与目标召回实体对应的所述第一信息匹配,基于第一权重和搜索评分确定所述目标召回实体对应的评分值;若所述匹配结果为待链接实体与目标召回实体对应的所述第二信息匹配,基于第二权重和搜索评分确定所述目标召回实体对应的评分值。4.根据权利要求3所述的方法,其特征在于,所述第一信息为实体名称,第二信息为实体别名,所述第一权重大于所述第二权重。5.根据权利要求3所述的方法,其特征在于,所述第一信息为实体别名,第二信息为实体描述,所述第一权重大于所述第二权重。6.根据权利要求3所述的方法,其特征在于,所述第一信息为实体名称,第二信息为实体描述,所述第一权重大于所述第二权重。7.根据权利要求2所述的方法,其特征在于,所述实体信息包括实体名称、实体别名和实体描述,所述基于所述目标召回实体对应的权重和搜索评分,确定所述目标召回实体对应的评分值,包括:确定待链接实体与目标召回实体的实体信息的匹配结果;若所述匹配结果为待链接实体与目标召回实体对应的所述实体名称匹配,基于第一权重和搜索评分确定所述目标召回实体对应的评分值;若所述匹配结果为待链接实体与目标召回实体对应的所述实体别名匹配,基于第二权重和搜索评分确定所述目标召回实体对应的评分值;若所述匹配结果为待链接实体与目标召回实体对应的所述实体描述匹配,基于第三...

【专利技术属性】
技术研发人员:樊乘源刘海锋
申请(专利权)人:广东明创软件科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1