一种基于Multi-BiLSTM和竞争机制的命名实体识别方法、介质及装置制造方法及图纸

技术编号:40710708 阅读:15 留言:0更新日期:2024-03-22 11:12
本发明专利技术提供一种基于Multi‑BiLSTM和竞争机制的命名实体识别方法、介质及装置,所述方法包括:S1,词向量化模块基于BERT模型生成包含语义特征的词向量;S2,学习模块采用多个小尺度BiLSTM同步提取词向量上下文特征,并转换为标签序列,然后使用条件随机场CRF评价标签序列得分,并将误差反向传播进行模型训练;S3,应用模块采用优劣竞争机制选择学习模块中产生的相对较优的模型进行命名实体识别,然后采用投票竞争方式对命名实体识别结果进行综合分析,最终完成命名实体识别。本发明专利技术一是可以减小BiLSTM学习参数,二是引入了小尺度BiLSTM个数和获胜模型数,通过调整这两个参量可以优化NER性能。

【技术实现步骤摘要】

本专利技术涉及命名实体识别,具体而言,涉及一种基于multi-bilstm和竞争机制(competition mechanism,cm)的命名实体识别方法、介质及装置。


技术介绍

1、命名实体识别(named entity recognition,ner)作为自然语言处理的子任务,解决的是实体边界和类型识别问题。ner大致可分为基于规则的方法、基于统计的方法和基于深度学习的方法,其中,基于规则的方法出现较早,该方法通过人工设定特定字段的规则来匹配实体;基于统计的方法将ner任务转换为序列标记问题,通过学习人工标记的数据集得到实体的统计特性;基于深度学习的方法类似于序列标注任务,具体实现上充分利用深度神经网络的特性,对文本语义、语法及上下文关系进行学习,以支撑ner。相比基于规则的方法和基于统计的方法,基于深度学习的方法人工干预少、智能化程度高、模型泛化能力强,在ner中具有显著的技术优势。

2、在基于深度学习的ner实现过程中,bert具备较强文本语义捕捉能力,双向长短期记忆网络(bi-directional long short-term m本文档来自技高网...

【技术保护点】

1.一种基于Multi-BiLSTM和竞争机制的命名实体识别方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于Multi-BiLSTM和竞争机制的命名实体识别方法,其特征在于,步骤S2包括如下子步骤:

3.根据权利要求2所述的基于Multi-BiLSTM和竞争机制的命名实体识别方法,其特征在于,小尺度BiLSTM大小为大尺度BiLSTM的1/k。

4.根据权利要求2所述的基于Multi-BiLSTM和竞争机制的命名实体识别方法,其特征在于,步骤S23包括:

5.根据权利要求4所述的基于Multi-BiLSTM和竞争机制的命名实体...

【技术特征摘要】

1.一种基于multi-bilstm和竞争机制的命名实体识别方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于multi-bilstm和竞争机制的命名实体识别方法,其特征在于,步骤s2包括如下子步骤:

3.根据权利要求2所述的基于multi-bilstm和竞争机制的命名实体识别方法,其特征在于,小尺度bilstm大小为大尺度bilstm的1/k。

4.根据权利要求2所述的基于multi-bilstm和竞争机制的命名实体识别方法,其特征在于,步骤s23包括:

5.根据权利要求4所述的基于multi-bilstm和竞争机制的命名实体识别方法,其特征在于,所述损失函数定义为:

6.根据权利要求5所述的基于multi-bilstm和竞争机制的命名实体识别方法,其特征在于,步骤s3包括如下子步...

【专利技术属性】
技术研发人员:张位周阳曾浩洋刘佳诚
申请(专利权)人:中国电子科技集团公司第三十研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1