模型处理方法、识别方法、装置及电子设备和存储介质制造方法及图纸

技术编号:39039533 阅读:20 留言:0更新日期:2023-10-10 11:52
本申请实施例公开了一种模型处理方法、识别方法、装置及电子设备和存储介质,通过命名实体识别模型对文本样本进行特征提取,得到文本样本的各个词的第一特征信息;基于每个词的第一注意力权重对每个词的第一特征信息进行优化,得到每个词的第二特征信息;通过命名实体识别模型对第二特征信息进行处理,获得文本样本中各个词的命名实体识别结果;至少基于各个词的命名实体识别结果及对应的第一类标签,对命名实体识别模型的参数,以及各个词的第一注意力权重进行更新;任一词对应的第一类标签表征该任一词是命名实体或不是命名实体。表征该任一词是命名实体或不是命名实体。表征该任一词是命名实体或不是命名实体。

【技术实现步骤摘要】
模型处理方法、识别方法、装置及电子设备和存储介质


[0001]本申请涉及自然语言处理
,更具体地说,涉及一种模型处理方法、识别方法、装置及电子设备和存储介质。

技术介绍

[0002]命名实体识别是自然语言处理领域的一项重要任务,用于识别命名实体的命名实体识别模型通常是通过带有标签的文本样本训练得到的。
[0003]目前,用于训练实体识别模型的文本样本的质量较低,比如,标签存在漏标命名实体的情况,使得实体识别模型的性能较差。

技术实现思路

[0004]本申请的目的是提供一种模型处理方法、识别方法、装置及电子设备和存储介质,包括如下技术方案:
[0005]一种模型处理方法,所述方法包括:
[0006]通过命名实体识别模型对文本样本进行特征提取,得到所述文本样本的各个词的第一特征信息;
[0007]基于每个词的第一注意力权重对每个词的第一特征信息进行优化,得到每个词的第二特征信息;
[0008]通过所述命名实体识别模型对所述第二特征信息进行处理,获得所述文本样本中各个词的命名实体识别结果;
[0009]至少基于各个词的命名实体识别结果及对应的第一类标签,对所述命名实体识别模型的参数,以及各个词的第一注意力权重进行更新;任一词对应的第一类标签表征该任一词是命名实体或不是命名实体。
[0010]上述方法,可选的,其中,基于每个词的第一注意力权重对每个词的第一特征信息进行优化,以降低所述文本样本中可能的假负例词的命名实体识别结果对所述命名实体识别模型的参数的更新的影响;
[0011]所述假负例词为所述文本样本中属于命名实体,且第一类标签错误的词。
[0012]上述方法,可选的,其中,所述第一特征信息为第一维度的第一向量,所述第二特征信息为所述第一维度的第二向量;任一词的第一注意力权重是所述第一维度的第三向量;
[0013]所述第二向量中任一位置的元素基于所述第一向量和所述第三向量中所述任一位置的元素得到;
[0014]所述第二向量中所述任一位置的元素的取值正相关于所述第三向量中所述任一位置的元素。
[0015]上述方法,可选的,还包括:
[0016]通过评价模型对所述文本样本中的各个实体词的第一特征信息进行处理,得到各
实体词的评价结果;任一实体词的评价结果表征所述任一实体词与所述文本样本所属领域的相关程度;
[0017]所述至少基于各个词的命名实体识别结果及对应的第一类标签,对所述命名实体识别模型的参数,以及各个词的第一注意力权重进行更新,包括:
[0018]基于各个词的命名实体识别结果及对应的第一类标签,以及各个实体词的评价结果,对所述命名实体识别模型的参数,所述评价模型的参数以及各个词的第一注意力权重进行更新。
[0019]上述方法,可选的,表征命名实体的第一类标签是通过标注模型基于所述表征命名实体的第一类标签对应的语义信息对所述文本样本进行标注得到。
[0020]上述方法,可选的,所述标注模型为机器阅读理解模型;通过所述机器阅读理解模型基于所述表征命名实体的第一类标签对应的语义信息对所述文本样本进行标注的过程,包括:
[0021]将所述文本样本和所述表征命名实体的第一类标签对应的语义信息输入所述机器阅读理解模型,得到所述机器阅读理解模型从所述文本样本中提取的与所述语义信息对应的词;
[0022]针对所提取的词标注所述表征命名实体的第一类标签。
[0023]一种模型处理方法,所述方法包括
[0024]通过命名实体识别模型对文本样本进行特征提取,得到所述文本样本的各个词的第一特征信息;
[0025]通过所述命名实体识别模型对所述第一特征信息进行处理,获得所述文本样本中各个词的命名实体识别结果;
[0026]获得各个词的命名实体识别结果与对应的第一类标签的差异;任一词对应的第一类标签表征该任一词是命名实体或不是命名实体;
[0027]基于每个词的第一注意力权重对每个词对应的差异进行优化,得到每个词对应的优化后差异;
[0028]至少基于各个词对应的优化后差异对所述命名实体识别模型的参数,以及各个词的第一注意力权重进行更新。
[0029]上述方法,可选的,还包括:
[0030]通过评价模型对所述文本样本中的各个实体词的第一特征信息进行处理,得到各实体词的评价结果;任一实体词的评价结果表征所述任一实体词与所述文本样本所属领域的相关程度;
[0031]所述至少基于各个词对应的优化后差异对所述命名实体识别模型的参数,以及各个词的第一注意力权重进行更新,包括:
[0032]基于各个词的对应的优化后差异,以及各个实体词的评价结果,对所述命名实体识别模型的参数,所述评价模型的参数以及各个词的第一注意力权重进行更新。
[0033]上述方法,可选的,表征命名实体的第一类标签是通过标注模型基于所述表征命名实体的第一类标签对应的语义信息对所述文本样本进行标注得到。
[0034]一种命名实体识别方法,包括:
[0035]获得目标文本;
[0036]将所述目标文本输入命名实体识别模型,以便所述命名实体识别模型对目标文本进行特征提取,得到所述目标文本的各个词的特征信息;对所述目标文本的各个词的特征信息进行处理,得到所述目标文本的各个词的命名实体识别结果;
[0037]所述命名实体识别模型通过如上任一项所述的模型处理方法得到。
[0038]一种模型处理装置,所述装置包括:
[0039]第一特征提取模块,用于通过命名实体识别模型对文本样本进行特征提取,得到所述文本样本的各个词的第一特征信息;
[0040]第一优化模块,用于基于每个词的第一注意力权重对每个词的第一特征信息进行优化,得到每个词的第二特征信息;
[0041]第一处理模块,用于通过所述命名实体识别模型对所述第二特征信息进行处理,获得所述文本样本中各个词的命名实体识别结果;
[0042]第一更新模块,用于至少基于各个词的命名实体识别结果及对应的第一类标签,对所述命名实体识别模型的参数,以及各个词的第一注意力权重进行更新;任一词对应的第一类标签表征该任一词是命名实体或不是命名实体。
[0043]一种模型处理装置,所述装置包括:
[0044]第二特征提取模块,用于通过命名实体识别模型对文本样本进行特征提取,得到所述文本样本的各个词的第一特征信息;
[0045]第二处理模块,用于通过所述命名实体识别模型对所述第一特征信息进行处理,获得所述文本样本中各个词的命名实体识别结果;
[0046]差异获得模块,用于获得各个词的命名实体识别结果与对应的第一类标签的差异;任一词对应的第一类标签表征该任一词是命名实体或不是命名实体;
[0047]第二优化模块,用于基于每个词的注意力权重对每个词对应的差异进行优化,得到每个词对应的优化后差异;
[0048]第二更新模块,用于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型处理方法,所述方法包括:通过命名实体识别模型对文本样本进行特征提取,得到所述文本样本的各个词的第一特征信息;基于每个词的第一注意力权重对每个词的第一特征信息进行优化,得到每个词的第二特征信息;通过所述命名实体识别模型对所述第二特征信息进行处理,获得所述文本样本中各个词的命名实体识别结果;至少基于各个词的命名实体识别结果及对应的第一类标签,对所述命名实体识别模型的参数,以及各个词的第一注意力权重进行更新;任一词对应的第一类标签表征该任一词是命名实体或不是命名实体。2.根据权利要求1所述的方法,其中,基于每个词的第一注意力权重对每个词的第一特征信息进行优化,以降低所述文本样本中可能的假负例词的命名实体识别结果对所述命名实体识别模型的参数的更新的影响;所述假负例词为所述文本样本中属于命名实体,且第一类标签错误的词。3.根据权利要求1所述的方法,其中,所述第一特征信息为第一维度的第一向量,所述第二特征信息为所述第一维度的第二向量;任一词的第一注意力权重是所述第一维度的第三向量;所述第二向量中任一位置的元素基于所述第一向量和所述第三向量中所述任一位置的元素得到;所述第二向量中所述任一位置的元素的取值正相关于所述第三向量中所述任一位置的元素。4.根据权利要求1所述的方法,还包括:通过评价模型对所述文本样本中的各个实体词的第一特征信息进行处理,得到各实体词的评价结果;任一实体词的评价结果表征所述任一实体词与所述文本样本所属领域的相关程度;所述至少基于各个词的命名实体识别结果及对应的第一类标签,对所述命名实体识别模型的参数,以及各个词的第一注意力权重进行更新,包括:基于各个词的命名实体识别结果及对应的第一类标签,以及各个实体词的评价结果,对所述命名实体识别模型的参数,所述评价模型的参数以及各个词的第一注意力权重进行更新。5.根据权利要求1所述的方法,表征命名实体的第一类标签是通过标注模型基于所述表征命名实体的第一类标签对应的语义信息对所述文本样本进行标注得到。6.根据权利要求5所述的方法,所述标注模型为机器阅读理解模型;通过所述机器阅读理解模型基于所述表征命名实体的第一类标签对应的语义信息对所述文本样本进行标注的过程,包括:将所述文本样本和所述表征命名实体的第一类标签对应的语义信息输入所述机器阅读理解模型,得到所述机器阅读理解模型从所述文...

【专利技术属性】
技术研发人员:刘雁云石健陈梓康
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1