实体识别方法、装置、设备及存储介质制造方法及图纸

技术编号:41418092 阅读:29 留言:0更新日期:2024-05-21 20:51
本申请公开了一种实体识别方法、装置、设备及存储介质,涉及AI技术领域。所述方法包括:获取待识别文本的特征信息,待识别文本的特征信息用于表征待识别文本的语义特征;根据待识别文本的特征信息,确定待识别文本中的至少一个候选实体词;确定各个候选实体词的重要度指标,重要度指标用于表征候选实体词在待识别文本中的重要程度;根据各个候选实体词的重要度指标,确定待识别文本的实体词识别结果。本申请通过对抽取到的实体词进行重要程度的划分,提高了实体识别模型抽取结果的准确性。

【技术实现步骤摘要】

本申请涉及ai(artificial intelligence,人工智能),特别涉及一种实体识别方法、装置、设备及存储介质


技术介绍

1、结合自然语言处理等基础算法对文本内容进行解析,强化对文本内容语义信息的理解,是搜索系统的核心工作。其中,基于文本标题抽取文本内容的实体信息是理解文本内容的重要步骤。

2、相关技术中,通过实体识别模型对文本中可抽取的实体词进行抽取,抽取到的实体词可以用于表示文本中的主要内容。

3、然而,上述实体识别模型容易抽取到错误的实体词,导致抽取的实体结果不准确。


技术实现思路

1、本申请实施例提供了一种实体识别方法、装置、设备及存储介质。所述技术方案如下:

2、根据本申请实施例的一个方面,提供了一种实体识别方法,所述方法包括:

3、获取待识别文本的特征信息,所述待识别文本的特征信息用于表征所述待识别文本的语义特征;

4、根据所述待识别文本的特征信息,确定所述待识别文本中的至少一个候选实体词;

5、确定各个所述候选本文档来自技高网...

【技术保护点】

1.一种实体识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述确定各个所述候选实体词的重要度指标,包括:

3.根据权利要求2所述的方法,其特征在于,所述待识别文本的特征信息包括第一特征向量,所述第一特征向量用于表征所述待识别文本整体的语义特征;

4.根据权利要求1所述的方法,其特征在于,所述根据各个所述候选实体词的重要度指标,确定所述待识别文本的实体词识别结果,包括:

5.根据权利要求1所述的方法,其特征在于,所述根据各个所述候选实体词的重要度指标,确定所述待识别文本的实体词识别结果,包括:

6...

【技术特征摘要】

1.一种实体识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述确定各个所述候选实体词的重要度指标,包括:

3.根据权利要求2所述的方法,其特征在于,所述待识别文本的特征信息包括第一特征向量,所述第一特征向量用于表征所述待识别文本整体的语义特征;

4.根据权利要求1所述的方法,其特征在于,所述根据各个所述候选实体词的重要度指标,确定所述待识别文本的实体词识别结果,包括:

5.根据权利要求1所述的方法,其特征在于,所述根据各个所述候选实体词的重要度指标,确定所述待识别文本的实体词识别结果,包括:

6.根据权利要求1所述的方法,其特征在于,所述根据所述待识别文本的特征信息,确定所述待识别文本中的至少一个候选实体词,包括:

7.根据权利要求6所述的方法,其特征在于,所述根据所述待识别文本的特征信息,确定所述待识别文本的主题类目信息,包括:

8.根据权利要求6所述的方法,其特征在于,所述待识别文本的特征信息包括所述待识别文本中的多个元素分别对应的特征向量;

9.根据权利要求1至8任一项所述的方法,其特征在于,所述待识别文本的实体词识别结果由实体识别模型确定,所述实体识别模型包括特征提取网络、实体识别网络和匹配回归网络;

10.一种实体识别模型的训练方法,其特征在于,所述实体识别模型包括特征提取网络、实体识别网络和匹配回归网络,所述方法包括:

11.根据权利要求10所述的方法,其特征在于,所述根据所述样本文本的实体词预测结果、核心实体预测结果、实体词标注结果和核心实体标注结果,对所述实体识别模型进行训练,包括:

12.根据权利要求11所述的方法,其特征在于,所述实体词预测结果包括所述样本文本中的...

【专利技术属性】
技术研发人员:黄剑辉
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1