命名实体识别方法、装置、设备及介质制造方法及图纸

技术编号:35306965 阅读:21 留言:0更新日期:2022-10-22 12:57
本申请涉及人工智能技术领域,提供一种命名实体识别方法、装置、设备及介质,方法包括:获取待识别句子;根据预设的输入模板将所述待识别句子中的每一个字依次作为[w],输入预先训练好的标注识别模型进行识别,得到对应的标注识别结果;其中,所述输入模板为[CLS],w11,w12,w13,

【技术实现步骤摘要】
命名实体识别方法、装置、设备及介质


[0001]本申请涉及人工智能
,尤其涉及一种命名实体识别方法、装置、设备及介质。

技术介绍

[0002]命名实体识别(Named Entity Recognition,简称NER),又称作“专名识别”,是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。业内提出命名实体识别一般使用CRF模型,或者LSTM+CRF模型进行识别,若是使用这些模型,在模型训练前,需要对命名实体所在的句子进行BMES的四种标注,B表示一个词的词首位值,M表示一个词的中间位置,E表示一个词的末尾位置,S表示一个单独的字词,由于这类标注方法需要BMES四种标注,因此,标注成本较大。

技术实现思路

[0003]针对上述技术问题,本申请的目的在于提供一种命名实体识别方法、装置、设备及介质,旨在解决采用CRF模型,或者LSTM+CRF模型进行命名实体识别,标注成本大的问题。
[0004]第一方面,本专利技术实施例提供一种命名实体识别方法,包括:
[0005]获取待识别句子;
[0006]根据预设的输入模板将所述待识别句子中的每一个字依次作为[w],输入预先训练好的标注识别模型进行识别,得到对应的标注识别结果;其中,所述输入模板为[CLS],w11,w12,w13,

,w1n,[sep],[w],是,[label],实,体,[sep],[CLS]代表句向量,w11代表句子中的第一个字,w12代表句子中的第二个字,w13代表句子中的第三个字,w1n代表句子中的第n个字,[sep]是分割符,[w]是句子中的字,[label]是模型需要预测的标注;所述预先训练好的标注识别模型是通过基于待训练句子以及所述待训练句子每个字的标注对Bert模型进行训练得到;
[0007]将属于实体的标注对应的字从所述待识别句子中提取出来,得到命名实体识别结果。
[0008]进一步的,在获取待识别句子之前,还包括:
[0009]将所述Bert模型的输入模板[CLS],w11,w12,w13,

,w1n,[sep],w21,w22,w23,

,w2n,[sep]替换为所述预设的输入模板[CLS],w11,w12,w13,

,w1n,[sep],[w],是,[label],实,体,[sep];其中,w21代表第二个句子中的第一个字,w22代表第二个句子中的第二个字,w23代表第二个句子中的第三个字,w2n代表第二个句子中的第n个字。
[0010]进一步的,每一个实体的标注都由带有第一字母和第二字母结尾的字符组成,非实体字的标注都用第三字母表示。
[0011]进一步的,实体的第一个字对应的标注用XB表示,实体的其他字对应的标注均用XN表示,非实体字的标注用S表示,其中,对于不同类型的实体,X不同,X可以是任一一个字母。
[0012]进一步的,所述标注包括NB,NM,OB,OM,AB,AM,S;其中,NB代表姓名开头,NM代表姓名其他,OB代表机构名开头,OM代表机构名其他,AB代表地址名开头,AM代表地址名其他,S代表其他非实体的字。
[0013]进一步的,所述预先训练好的标注识别模型通过如下方式训练得到:
[0014]获取待训练句子以及所述待训练句子每个字的标注;
[0015]基于待训练句子以及所述待训练句子每个字的标注,采用交叉熵损失函数以及梯度反向传播方法对所述Bert模型进行训练得到。
[0016]第二方面,本专利技术实施例提供一种命名实体识别装置,包括:
[0017]获取模块,用于获取待识别句子;
[0018]输入模块,用于根据预设的输入模板将所述待识别句子中的每一个字依次作为[w],输入预先训练好的标注识别模型进行识别,得到对应的标注识别结果;其中,所述输入模板为[CLS],w11,w12,w13,

,w1n,[sep],[w],是,[label],实,体,[sep],[CLS]代表句向量,w11代表句子中的第一个字,w12代表句子中的第二个字,w1n代表句子中的第n个字,[sep]是分割符,[w]是句子中的字,[label]是模型需要预测的标注;所述预先训练好的标注识别模型是通过基于待训练句子以及所述待训练句子每个字的标注对Bert模型进行训练得到;
[0019]提取模块,用于将属于实体的标注对应的字从所述待识别句子中提取出来,得到命名实体识别结果。
[0020]进一步的,所述的命名实体识别装置,还包括:
[0021]替换模块,用于将所述Bert模型的输入模板[CLS],w11,w12,w13,

,w1n,[sep],w21,w22,w23,

,w2n,[sep]替换为所述预设的输入模板[CLS],w11,w12,w13,

,w1n,[sep],[w],是,[label],实,体,[sep]。
[0022]第三方面,本专利技术实施例提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
[0023]第四方面,本专利技术实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
[0024]本专利技术实施例提供一种命名实体识别方法,包括:获取待识别句子;根据预设的输入模板将所述待识别句子中的每一个字依次作为[w],输入预先训练好的标注识别模型进行识别,得到对应的标注识别结果;其中,所述输入模板为[CLS],w11,w12,w13,

,w1n,[sep],[w],是,[label],实,体,[sep],[CLS]代表句向量,w11代表句子中的第一个字,w12代表句子中的第二个字,w13代表句子中的第三个字,w1n代表句子中的第n个字,[sep]是分割符,[w]是句子中的字,[label]是模型需要预测的标注;所述预先训练好的标注识别模型是通过基于待训练句子以及所述待训练句子每个字的标注对Bert模型进行训练得到;将属于实体的标注对应的字从所述待识别句子中提取出来,得到命名实体识别结果。由于本专利技术实施例采用的并非是CRF模型,或者LSTM+CRF模,而是使用的是bert模型,且将bert模型输入模板[CLS],w11,w12,w13,

,w1n,[sep],w21,w22,w23,

,w2n,[sep]改为[CLS],w11,w12,w13,

,w1n,[sep],[w],是,[label],实,体,[sep],其中,[CLS]代表句向量,w11代表句子中的第一个字,w12代表句子中的第二个字,w1n代表句子中的第n个字,[sep]是分割符,[w]是句子中的字,[label]是模型需要预测的标注;由于本专利技术模板是基于字级本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种命名实体识别方法,其特征在于,包括:获取待识别句子;根据预设的输入模板将所述待识别句子中的每一个字依次作为[w],输入预先训练好的标注识别模型进行识别,得到对应的标注识别结果;其中,所述输入模板为[CLS],w11,w12,w13,

,w1n,[sep],[w],是,[label],实,体,[sep],[CLS]代表句向量,w11代表句子中的第一个字,w12代表句子中的第二个字,w13代表句子中的第三个字,w1n代表句子中的第n个字,[sep]是分割符,[w]是句子中的字,[label]是模型需要预测的标注;所述预先训练好的标注识别模型是通过基于待训练句子以及所述待训练句子每个字的标注对Bert模型进行训练得到;将属于实体的标注对应的字从所述待识别句子中提取出来,得到命名实体识别结果。2.根据权利要求1所述的命名实体识别方法,其特征在于,在获取待识别句子之前,还包括:将所述Bert模型的输入模板[CLS],w11,w12,w13,

,w1n,[sep],w21,w22,w23,

,w2n,[sep]替换为所述预设的输入模板[CLS],w11,w12,w13,

,w1n,[sep],[w],是,[label],实,体,[sep];其中,w21代表第二个句子中的第一个字,w22代表第二个句子中的第二个字,w23代表第二个句子中的第三个字,w2n代表第二个句子中的第n个字。3.根据权利要求1所述的命名实体识别方法,其特征在于,每一个实体的标注都由带有第一字母和第二字母结尾的字符组成,非实体字的标注都用第三字母表示。4.根据权利要求3所述的命名实体识别方法,其特征在于,实体的第一个字对应的标注用XB表示,实体的其他字对应的标注均用XN表示,非实体字的标注用S表示,其中,对于不同类型的实体,X不同,X可以是任一一个字母。5.根据权利要求4所述的所述命名实体识别方法,其特征在于,所述标注包括NB,NM,OB,OM,AB,AM,S;其中,NB代表姓名开头,NM代表姓名其他,OB代表机构名开头,OM代表...

【专利技术属性】
技术研发人员:舒畅陈又新
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1