命名实体识别模型的训练方法和装置、识别方法和装置制造方法及图纸

技术编号:30424877 阅读:35 留言:0更新日期:2021-10-24 16:56
本申请公开一种命名实体识别模型的训练方法和装置,命名实体的识别方法和装置,计算机存储介质和电子设备。其中,训练方法包括:基于获取的百科数据构造训练数据,所述知识类数据包括:知识类关键数据以及所述关键数据的描述内容;在深度双向语言表征模型的初始模型中,采用训练数据进行模型训练,获得融入有知识类数据的深度双向语言表征模型;利用融入有知识类数据的深度双向语言表征模型,进行命名实体识别训练,获得融入有知识类数据且能够识别命名实体的命名实体识别模型;进而能够在基于融入的知识类数据能够在已有训练数据较少的情况下,保证命名实体识别模型识别的准确性。性。性。

【技术实现步骤摘要】
命名实体识别模型的训练方法和装置、识别方法和装置


[0001]本申请涉及计算机应用
,具体涉及一种命名实体识别模型的训练 方法和装置,以及一种命名实时识别的识别方法和装置,计算机存储介质和电 子设备。

技术介绍

[0002]近几年来,基于神经网络的深度学习方法在计算机视觉、语音识别等领域 被广泛的应用。其中,命名实体识别作为自然语言处理的基本任务之一,也被 广泛的应用在关系抽取、事件抽取、知识图谱、机器翻译、问答系统等领域。
[0003]命名实体识别主要依赖于人工搜集的领域词典,每个词典包含词语列表及 其对应的类型,通过在训练时加入词典匹配特征作为命名实体识别模型的输入 来加入领域知识,从而完成命名实体的识别。然而,构建词典需要耗费很多人 力,并且构建过程中往往会引入很多错误信息,导致模型被引入噪声,进而使 得命名实体识别模型的识别准确率低,且人力成本较大。

技术实现思路

[0004]本申请提供一种命名实体识别模型的训练方法,以解决现有技术中命名实 体识别准确率低的问题。
[0005]本申请提供一种命名实体本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种命名实体识别模型的训练方法,其特征在于,包括:基于获取的知识类数据构造训练数据,所述知识类数据包括:知识类关键数据以及所述知识类关键数据的描述内容;在深度双向语言表征模型的初始模型中,采用所述训练数据进行模型训练,获得融入有知识类数据的深度双向语言表征模型;利用所述融入有知识类数据的深度双向语言表征模型,进行命名实体识别训练,获得融入有知识类数据且能够识别命名实体的命名实体识别模型。2.根据权利要求1所述的命名实体识别模型的训练方法,其特征在于,所述基于获取的知识类数据构造训练数据,包括:选取所述知识类关键数据的描述内容中包括相同知识类关键数据的数据对,构成第一数据对;选取所述知识类关键数据的描述内容中包括不同知识类关键数据的数据对,构成第二数据对;按照设置的遮蔽范围,将所述第一数据对和第二数据对中的知识类关键数据进行遮蔽;将遮蔽后的所述第一数据对和第二数据对确定为所述训练数据。3.根据权利要求2所述的命名实体识别模型的训练方法,其特征在于,所述选取所述知识类关键数据的描述内容中包括相同知识类关键数据的数据对,构成第一数据对,包括:对所述知识类关键数据的描述内容按照设置的切分方式进行切分,获得切分后的描述内容;对切分后的描述内容按照设置的分类方式进行分类,获得至少两个数据集合;在至少两个数据集合中选取所述包括相同知识类关键数据的数据对,构成所述第一数据对。4.根据权利要求3所述的命名实体识别模型的训练方法,其特征在于,所述选取所述知识类关键数据的描述内容中包括不同知识类关键数据的数据对,构成第二数据对,包括:在所述至少两个数据集合中,分别选取所述包括不同知识类关键数据的数据对,构成第二数据对。5.根据权利要求3或4所述的命名实体识别模型的训练方法,其特征在于,所述对所述知识类关键数据的描述内容按照设置的切分方式进行切分,获得切分后的描述内容,包括:对所述描述内容按照句子进行切分,获得切分后的描述内容。6.根据权利要求3所述的命名实体识别模型的训练方法,其特征在于,所述对切分后的描述内容按照设置的分类方式进行分类,获得至少两个数据集合,包括:对切分后的描述内容按照所述知识类关键数据进行分类,获得包括所述知识类关键数据的第一数据集合,以及不包括所述知识类关键数据的第二数据集合。7.根据权利要求2所述的命名实体识别模型的训练方法,其特征在于,所述选取所述知识类关键数据的描述内容中包括不同知识类关键数据的数据对,构成第二数据对,包括:选取与所述第一数据对数量匹配的,所述描述内容中包括不同知识类关键数据的数据对,构成第二数据对。8.根据权利要求1所述的命名实体识别模型的训练方法,其特征在于,所述在深度双向
语言表征模型的初始模型中,采用所述训练数据进行模型训练,获得融入有知识类数据的深度双向语言表征模型,包括:根据原始语料获取训练的深度双向语言表征模型的初始模型;在所述初始模型的基础上,采用所述训练数据进行训练,获得融入有知识类数据的深度双向语言表征模型。9.根据权利要求8所述的命名实体识别模型的训练方法,其特征在于,所述在所述初始模型的基础上,采用所述训练数据进行训练,获得融入有知识类数据的深度双向语言表征模型,包括:采用所述训练数据分别进行遮蔽数据预测的训练和下一个语句预测的训练,获得融入有知识类数据的深度双向语言表征模型。10.根据权利要求1所述的命名实体识别模型的训练方法,其特征在于,所述利用所述融入有知识类数据的深度双向语言...

【专利技术属性】
技术研发人员:丁瑞雪龙定坤黄非马春平徐光伟王潇斌司罗谢朋峻
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1