【技术实现步骤摘要】
命名实体识别方法、装置、电子设备及存储介质
[0001]本公开实施例涉及计算机
,更具体地,涉及一种命名实体识别方法、装置、电子设备及存储介质。
技术介绍
[0002]命名实体识别(Named Entity Recognition,NER)是指识别自然语言文本中具有特定意义的实体,实体主要包括人名、地名、组织名、时间、金钱和日期等。命名实体识别是信息抽取、信息检索和机器翻译等多种自然语言处理(Natural Language Processing,NLP)技术必不可少的组成部分。
[0003]在自然语言处理中,由于命名实体识别通常是自然语言理解的第一步,其识别结果会被用于多种后续的NLP任务,因此,命名实体识别的准确率高低至关重要。
[0004]在实现本公开构思的过程中,专利技术人发现相关技术中至少存在如下问题:采用相关技术进行命名实体识别的准确率不高。
技术实现思路
[0005]有鉴于此,本公开实施例提供了一种命名实体识别方法、装置、电子设备及存储介质。
[0006]本公开实施 ...
【技术保护点】
【技术特征摘要】
1.一种命名实体识别方法,包括:获取待识别文本;对所述待识别文本进行特征提取,得到目标全局特征向量和目标局部特征向量;将所述目标全局特征向量和所述目标局部特征向量进行拼接,得到目标特征向量;以及利用命名实体识别模型处理所述目标特征向量,得到用于表征所述待识别文本的实体类别识别结果。2.根据权利要求1所述的方法,其中,所述目标局部特征向量包括第一句子级特征向量和第二句子级特征向量;所述对所述待识别文本进行特征提取,得到目标局部特征向量,包括:获取字典,其中,所述字典包括多个实体和与每个所述实体对应的实体类别,所述实体类别包括多种;从所述字典中查找与所述待识别文本中的每个词组元素所匹配的实体;根据预设匹配规则,确定每个所述词组元素和与每个所述词组元素所匹配的实体之间的匹配程度;根据与每个所述词组元素所匹配的实体对应的实体类别,以及,每个所述词组元素和与每个所述词组元素所匹配的实体之间的匹配程度,得到所述第一句子级特征向量;以及利用预设转换规则处理所述待识别文本得到所述第二句子级特征向量,其中,所述预设转换规则用于将所述待识别文本中的大写字母、小写字母、数字和标点分别转换为对应的预设形式。3.根据权利要求2所述的方法,其中,所述根据与每个所述词组元素所匹配的实体对应的实体类别,以及,每个所述词组元素和与每个所述词组元素所匹配的实体之间的匹配程度,得到所述第一句子级特征向量,包括:根据与每个所述词组元素所匹配的实体对应的实体类别,以及,每个所述词组元素和与每个所述词组元素所匹配的实体之间的匹配程度,得到与每个所述词组元素对应的向量,其中,所述向量中的每个分量用于表征所述词组元素与对应的所述实体类别的匹配程度;以及根据所述待识别文本中的与每个所述词组元素对应的向量,得到所述第一句子级特征向量。4.根据权利要求2所述的方法,其中,所述目标局部特征向量还包括字符级特征向量;所述对所述待识别文本进行特征提取,得到目标局部特征向量,包括:利用嵌入字符提取模型处理所述待识别文本,得到嵌入字符,其中,所述嵌入字符提取模型是基于第一神经网络模型训练生成的;以及利用字符级特征提取模型处理所述嵌入字符,得到所述字符级特征向量,其中,所述字符级特征提取模型是基于卷积神经网络模型训练生成的。5.根据权利要求1所述的方法,其中,所述目标全局特征向量包括单词级特征向量;所述对所述待识别文本进行特征提取,得到目标全局特征向量...
【专利技术属性】
技术研发人员:金鑫,
申请(专利权)人:北京京东世纪贸易有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。