实体匹配方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:43106415 阅读:18 留言:0更新日期:2024-10-26 09:48
本申请的实施例公开了一种实体匹配方法、装置、设备及计算机可读存储介质。该方法包括:基于第一特征向量和第二特征向量计算得到预测指称特征向量;基于预测指称特征向量在知识库中确定至少一个候选实体,并获取至少一个候选实体的特征向量;基于第一特征向量、第二特征向量和预测指称特征向量计算得到预测指称融合向量;将预测指称融合向量和至少一个候选实体的特征向量进行相似度计算,得到至少一个相似度值,并基于至少一个相似度值从至少一个候选实体中选择目标候选实体。通过该方法,可以提高实体匹配的准确性。

【技术实现步骤摘要】

本申请涉及计算机领域,具体涉及一种实体匹配方法、装置、设备和计算机可读存储介质。


技术介绍

1、实体链接是将文本中提到的指称与其知识库中相应的实体进行链接起来的任务,可以解决实体间存在的歧义性问题。实体链接的过程中需要进行指称识别和实体消歧,其中,指称识别也称为ner(named entity recognition,命名实体识别),可以识别出文本中的人名、地名等专有名称和有意义的时间、日期等相关实体并加以归类。实体消歧能够消除指称识别结果中存在的歧义问题,以找到与所识别出来的指称相匹配的实体。

2、相关技术中,在对文本进行指称识别处理,生成指称识别结果后,可将该指称识别结果进行实体消歧。然而,当指称识别时生成了错误的指称识别结果,那么进行实体消歧时也会出错,会造成指称匹配到错误的实体上,导致最终的实体链接结果出错。

3、因此,如何提高实体匹配的准确性是亟待解决的问题。


技术实现思路

1、为解决上述技术问题,本申请的实施例提供了一种实体匹配方法、装置、设备以及计算机可读存储介质,可以提本文档来自技高网...

【技术保护点】

1.一种实体匹配方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于第一特征向量和第二特征向量计算得到预测指称特征向量,包括:

3.根据权利要求2所述的方法,其特征在于,在所述将所述第一特征向量和第二特征向量进行相加运算,得到待预测指称特征向量之前,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述第一特征向量的维度是基于所述预设训练模型所包括的预设向量维度信息所确定的;

5.根据权利要求2所述的方法,其特征在于,所述基于所述待识别文本的上下文信息在所述多个待预测指称特征向量片段中选择出所述预测指称特征...

【技术特征摘要】

1.一种实体匹配方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于第一特征向量和第二特征向量计算得到预测指称特征向量,包括:

3.根据权利要求2所述的方法,其特征在于,在所述将所述第一特征向量和第二特征向量进行相加运算,得到待预测指称特征向量之前,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述第一特征向量的维度是基于所述预设训练模型所包括的预设向量维度信息所确定的;

5.根据权利要求2所述的方法,其特征在于,所述基于所述待识别文本的上下文信息在所述多个待预测指称特征向量片段中选择出所述预测指称特征向量,包括:

6.根据权利要求1所述的方法,其特征在于,所述基于所述预测指称特征向量在知识库中确定至少一个候选实...

【专利技术属性】
技术研发人员:蒲仁杰孙福宁
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1