实体识别及其模型训练方法、装置、电子设备与存储介质制造方法及图纸

技术编号:40040910 阅读:14 留言:0更新日期:2024-01-16 19:42
本申请公开一种实体识别及其模型训练方法、装置、电子设备与存储介质,实体识别模型至少包括嵌入层、掩码层和输出层,实体识别模型训练方法包括至少一轮训练过程,任意一轮训练过程包括:掩码层从实体信息序列中确定并标记目标位置;其中,目标位置包括:已经存在实体的位置及部分不存在实体的位置;掩码层基于目标位置,生成与实体信息序列对应的掩码信息;嵌入层基于与实体信息序列对应的训练文本序列,生成训练文本序列对应的三维张量信息并输入至掩码层;掩码层对掩码信息和三维张量信息进行特征交叉处理,得到特征交叉信息并输入至输出层;输出层基于特征交叉信息,确定实体识别模型的损失;损失用于调整实体识别模型的模型参数。

【技术实现步骤摘要】

本公开涉及人工智能,更具体的,涉及一种实体识别及其模型训练方法、装置、电子设备与存储介质


技术介绍

1、目前,实体识别标注任务场景非常多,例如实体问答标注任务,所谓的实体问答标注任务,即为实体识别模型针对输入的语料进行实体问答并标注问答出的该实体。在实体问答标注任务中,标注缺失的问题比较突出,所谓的标注缺失,指的是在实际标注过程中,由于实体识别模型的问答语料不全,使得实体标注不全,进而导致问答标注的结果会有缺失。这些缺失的标注会继续对模型的下一次学习产生误导,导致模型学偏,影响最后模型学习的效果。


技术实现思路

1、本公开实施例的一个目的是提供一种实体识别模型训练的新的技术方案。

2、根据本公开的第一方面,提供了一种实体识别模型训练方法,其中,所述实体识别模型至少包括嵌入层、掩码层和输出层,所述实体识别模型训练方法包括至少一轮训练过程,任意一轮所述训练过程包括:

3、所述掩码层从实体信息序列中确定并标记目标位置;其中,所述目标位置包括:已经存在实体的位置及部分不存在实体的位置;...

【技术保护点】

1.一种实体识别模型训练方法,其特征在于,所述实体识别模型至少包括嵌入层、掩码层和输出层,所述实体识别模型训练方法包括至少一轮训练过程,任意一轮所述训练过程包括:

2.根据权利要求1所述的方法,其中,所述掩码层对所述掩码信息和所述三维张量信息进行特征交叉处理,得到特征交叉信息并输入至输出层,包括:

3.根据权利要求1所述的方法,其特征在于,所述掩码层基于所述目标位置,生成与所述实体信息序列对应的掩码信息,包括:

4.根据权利要求1所述的方法,其特征在于,所述掩码层基于所述目标位置,生成与所述实体信息序列对应的掩码信息,包括:

5.根据权利要...

【技术特征摘要】

1.一种实体识别模型训练方法,其特征在于,所述实体识别模型至少包括嵌入层、掩码层和输出层,所述实体识别模型训练方法包括至少一轮训练过程,任意一轮所述训练过程包括:

2.根据权利要求1所述的方法,其中,所述掩码层对所述掩码信息和所述三维张量信息进行特征交叉处理,得到特征交叉信息并输入至输出层,包括:

3.根据权利要求1所述的方法,其特征在于,所述掩码层基于所述目标位置,生成与所述实体信息序列对应的掩码信息,包括:

4.根据权利要求1所述的方法,其特征在于,所述掩码层基于所述目标位置,生成与所述实体信息序列对应的掩码信息,包括:

5.根据权利要求1所述的方法,其特征在于,所述方法还包括获取实体信息序列及其对应的训练文本序列的步骤,

6.一种实体识别方法,其特征在于,所述方...

【专利技术属性】
技术研发人员:谢佳雨王晨光王鹏陈伟
申请(专利权)人:第四范式北京技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1