【技术实现步骤摘要】
命名实体识别模型的训练方法和装置、识别方法和装置
[0001]本申请涉及计算机应用
,具体涉及一种命名实体识别模型的训练 方法和装置,以及一种命名实时识别的识别方法和装置,计算机存储介质和电 子设备。
技术介绍
[0002]近几年来,基于神经网络的深度学习方法在计算机视觉、语音识别等领域 被广泛的应用。其中,命名实体识别作为自然语言处理的基本任务之一,也被 广泛的应用在关系抽取、事件抽取、知识图谱、机器翻译、问答系统等领域。
[0003]命名实体识别主要依赖于人工搜集的领域词典,每个词典包含词语列表及 其对应的类型,通过在训练时加入词典匹配特征作为命名实体识别模型的输入 来加入领域知识,从而完成命名实体的识别。然而,构建词典需要耗费很多人 力,并且构建过程中往往会引入很多错误信息,导致模型被引入噪声,进而使 得命名实体识别模型的识别准确率低,且人力成本较大。
技术实现思路
[0004]本申请提供一种命名实体识别模型的训练方法,以解决现有技术中命名实 体识别准确率低的问题。
[0005]本 ...
【技术保护点】
【技术特征摘要】
1.一种命名实体识别模型的训练方法,其特征在于,包括:基于获取的知识类数据构造训练数据,所述知识类数据包括:知识类关键数据以及所述知识类关键数据的描述内容;在深度双向语言表征模型的初始模型中,采用所述训练数据进行模型训练,获得融入有知识类数据的深度双向语言表征模型;利用所述融入有知识类数据的深度双向语言表征模型,进行命名实体识别训练,获得融入有知识类数据且能够识别命名实体的命名实体识别模型。2.根据权利要求1所述的命名实体识别模型的训练方法,其特征在于,所述基于获取的知识类数据构造训练数据,包括:选取所述知识类关键数据的描述内容中包括相同知识类关键数据的数据对,构成第一数据对;选取所述知识类关键数据的描述内容中包括不同知识类关键数据的数据对,构成第二数据对;按照设置的遮蔽范围,将所述第一数据对和第二数据对中的知识类关键数据进行遮蔽;将遮蔽后的所述第一数据对和第二数据对确定为所述训练数据。3.根据权利要求2所述的命名实体识别模型的训练方法,其特征在于,所述选取所述知识类关键数据的描述内容中包括相同知识类关键数据的数据对,构成第一数据对,包括:对所述知识类关键数据的描述内容按照设置的切分方式进行切分,获得切分后的描述内容;对切分后的描述内容按照设置的分类方式进行分类,获得至少两个数据集合;在至少两个数据集合中选取所述包括相同知识类关键数据的数据对,构成所述第一数据对。4.根据权利要求3所述的命名实体识别模型的训练方法,其特征在于,所述选取所述知识类关键数据的描述内容中包括不同知识类关键数据的数据对,构成第二数据对,包括:在所述至少两个数据集合中,分别选取所述包括不同知识类关键数据的数据对,构成第二数据对。5.根据权利要求3或4所述的命名实体识别模型的训练方法,其特征在于,所述对所述知识类关键数据的描述内容按照设置的切分方式进行切分,获得切分后的描述内容,包括:对所述描述内容按照句子进行切分,获得切分后的描述内容。6.根据权利要求3所述的命名实体识别模型的训练方法,其特征在于,所述对切分后的描述内容按照设置的分类方式进行分类,获得至少两个数据集合,包括:对切分后的描述内容按照所述知识类关键数据进行分类,获得包括所述知识类关键数据的第一数据集合,以及不包括所述知识类关键数据的第二数据集合。7.根据权利要求2所述的命名实体识别模型的训练方法,其特征在于,所述选取所述知识类关键数据的描述内容中包括不同知识类关键数据的数据对,构成第二数据对,包括:选取与所述第一数据对数量匹配的,所述描述内容中包括不同知识类关键数据的数据对,构成第二数据对。8.根据权利要求1所述的命名实体识别模型的训练方法,其特征在于,所述在深度双向
语言表征模型的初始模型中,采用所述训练数据进行模型训练,获得融入有知识类数据的深度双向语言表征模型,包括:根据原始语料获取训练的深度双向语言表征模型的初始模型;在所述初始模型的基础上,采用所述训练数据进行训练,获得融入有知识类数据的深度双向语言表征模型。9.根据权利要求8所述的命名实体识别模型的训练方法,其特征在于,所述在所述初始模型的基础上,采用所述训练数据进行训练,获得融入有知识类数据的深度双向语言表征模型,包括:采用所述训练数据分别进行遮蔽数据预测的训练和下一个语句预测的训练,获得融入有知识类数据的深度双向语言表征模型。10.根据权利要求1所述的命名实体识别模型的训练方法,其特征在于,所述利用所述融入有知识类数据的深度双向语言...
【专利技术属性】
技术研发人员:丁瑞雪,龙定坤,黄非,马春平,徐光伟,王潇斌,司罗,谢朋峻,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。