实体识别方法、装置、设备及存储介质制造方法及图纸

技术编号:46472642 阅读:8 留言:0更新日期:2025-09-23 22:32
本申请公开了一种实体识别方法、装置、设备及存储介质,用于提高实体识别效率,以及解决因实体不可穷举、不同类型的实体之间容易混淆导致的识别准确率和全面性不佳的问题。实体识别方法包括:基于第一实体类型的描述文本,生成第一实体类型对应的多个第一指令;对第一文本进行采样得到文本序列,并通过第一模型预测文本序列中词语在每个第一指令下的概率;基于文本序列中词语在每个第一指令下的概率,从多个第一指令中确定适用于第一文本的第二指令;基于第二指令和第一模型,识别第一文本中属于第一实体类型的第一实体。

【技术实现步骤摘要】

本申请涉及自然语言处理,尤其涉及一种实体识别方法、装置、设备及存储介质


技术介绍

1、命名实体识别(named entity recognition,ner)是自然语言处理领域中一项极为关键的任务,其核心在于从文本中识别出具有特定意义的实体,比如人名、地名、组织机构名等类型的实体,以用于智能客服、金融服务、机器翻译、信息提取等业务。

2、在一些业务场景中,实体繁多且不可穷举,且不同实体类型的实体之间容易混淆,如何从自然语言文本中准确、全面地识别出指定实体类型的实体,成为研究的热点方向。


技术实现思路

1、本申请实施例的目的提供一种实体识别方法、装置、设备及存储介质,用于提高实体识别效率,以及解决因实体不可穷举、不同实体类型的实体之间容易混淆导致的识别准确率和全面性不佳的问题。

2、为了实现上述目的,本申请实施例采用下述技术方案:

3、第一方面,本申请实施例提供一种实体识别方法,包括:

4、基于第一实体类型的描述文本,生成所述第一实体类型对应的多个第一指令;...

【技术保护点】

1.一种实体识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述文本序列包含n个词语,n为正整数;所述文本序列中第t个词语在每个第一指令下的概率通过如下方式确定,1≤t≤n:

3.根据权利要求1所述的方法,其特征在于,所述基于所述文本序列中词语在每个第一指令下的概率,从所述多个第一指令中确定适用于所述第一文本的第二指令,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于每个词语在所述第一指令下的概率以及所述第一均值,确定所述第一指令的分值,包括:

5.根据权利要求4所述的方法,其特征在于,所述文本序列的数量为...

【技术特征摘要】

1.一种实体识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述文本序列包含n个词语,n为正整数;所述文本序列中第t个词语在每个第一指令下的概率通过如下方式确定,1≤t≤n:

3.根据权利要求1所述的方法,其特征在于,所述基于所述文本序列中词语在每个第一指令下的概率,从所述多个第一指令中确定适用于所述第一文本的第二指令,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于每个词语在所述第一指令下的概率以及所述第一均值,确定所述第一指令的分值,包括:

5.根据权利要求4所述的方法,其特征在于,所述文...

【专利技术属性】
技术研发人员:张健
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1