【技术实现步骤摘要】
命名实体识别方法、装置、存储介质及电子设备
[0001]本公开涉及自然语言处理领域,具体地,涉及一种命名实体识别方法、装置、存储介质及电子设备。
技术介绍
[0002]命名实体识别(Named Entity Recognition,简称NER)是生物医学领域自然语言处理应用的关键组成部分。在临床环境中,命名实体识别可用于从电子病历中提取和汇总相关信息,如隐藏在非结构化电子病历中的症状表现,病灶部位与诊断结果等。然而,目前的命名实体识别方法针对生物医学领域内复杂类型的命名实体(例如,嵌套式实体、非连续实体),通常无法有效识别。
技术实现思路
[0003]本公开的目的是提供一种命名实体识别方法、装置、存储介质及电子设备。
[0004]为了实现上述目的,本公开第一方面,提供了一种命名实体识别方法,所述方法包括:
[0005]获取待识别文本;
[0006]将所述待识别文本作为预设实体识别模型的输入,以使所述预设实体识别模型输出所述待识别文本中的命名实体;
[0007]其中,所述预设实体 ...
【技术保护点】
【技术特征摘要】
1.一种命名实体识别方法,其特征在于,所述方法包括:获取待识别文本;将所述待识别文本作为预设实体识别模型的输入,以使所述预设实体识别模型输出所述待识别文本中的命名实体;其中,所述预设实体识别模型用于获取由所述待识别文本中的每个字符形成的缓存队列,获取所述缓存队列中队首字符与预设归约栈中现存待定实体的关联度,根据所述关联度确定所述队首字符和/或所述待定实体对应的动作类型,所述动作类型为入栈动作,归约类动作或者出栈动作,通过执行所述动作类型对应的目标动作,以更新所述缓存队列中的所述队首字符和/或所述预设归约栈中的待定实体,并在所述目标动作包括所述出栈动作的情况下,将出栈后的所述待定实体作为所述待识别文本中的所述命名实体;所述归约类动作,用于将所述队首字符与最后入栈的预设数量个所述待定实体进行拼接后形成新的待定实体,并根据新的待定实体更新所述预设归约栈中现存的待定实体。2.根据权利要求1所述的方法,其特征在于,所述预设实体识别模型,用于:获取所述缓存队列中每个字符对应的第一特征向量;获取当前所述预设归约栈中最后入栈的预设数量个目标待定实体对应的第二特征向量;根据每个字符对应的所述第一特征向量和每个所述目标待定实体的所述第二特征向量确定该目标待定实体对应的注意力向量,所述注意力向量用于表征所述目标待定实体与所述缓存队列中每个字符的关联度;根据所述注意力向量确定所述缓存队列中队首字符和/或所述目标待定实体对应的动作类型;根据所述动作类型更新所述预设归约栈中的所述待定实体和所述缓存队列;循环执行所述获取所述缓存队列中每个字符对应的第一特征向量,至所述根据所述动作类型更新所述预设归约栈中的所述待定实体和所述缓存队列的步骤,直至所述预设归约栈和所述缓存队列均为空的情况下,将所述动作类型为出栈动作的待定实体确定为所述待识别文本中的命名实体。3.根据权利要求2所述的方法,其特征在于,所述预设实体识别模型包括注意力层,所述根据每个字符对应的所述第一特征向量和每个所述目标待定实体的所述第二特征向量确定该目标待定实体对应的注意力向量,包括:将所述目标待定实体的所述第二特征向量与所述缓存队列中每个字符对应的第一特征向量作为所述注意力层的输入,以使所述注意力层输出所述目标待定实体的对应的注意力向量。4.根据权利要求2所述的方法,其特征在于,所述预设实体识别模型包括分类层,所述根据所述注意力向量确定所述缓存队列中队首字符和/或所述目标待定实体对应的动作类型,包括:获取所述分类层上一次输出的历史动作类型对应的动作特征向量;将所述动作特征向量和每个所述目标待定实体对应的注意力向量作为所述分类层的输入,以使所述分类层输出当前所述队首字符和/或所述目标待定实体对应的所述动作类型。
5.根据权利要求2所述的方法,其特征在于,所述获取所述缓存队列中每个字符对应的第一特征向量,包括:获取当前所述缓存队列中每个字符对应的字符特征向量,以及每个字符对应的上下文特征向量;将每个字符对应的字符特征向量与该字符对应的所述上下文特征向量进行拼接,以得到所述缓存队...
【专利技术属性】
技术研发人员:李兴宇,蔡巍,张霞,
申请(专利权)人:沈阳东软智能医疗科技研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。