【技术实现步骤摘要】
一种命名实体识别方法、装置、设备以及介质
本专利技术涉及计算机
,特别是涉及一种命名实体识别方法、装置、设备以及介质。
技术介绍
命名实体识别是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。为了在命名体识别任务上得到更准确的结果,即对一句话中可能的命名实体(如人名、地名、机构名等)进行识别,传统方法将词表中的每一个词根据编号映射为一个词向量,并通过一些编码器将整句话中的词向量进行编码,最终预测每一个词所属的标签。但是,在一句话中,实体所占字符只占全部字符的少数,大部分的字符需要被模型标注为“负样本”,而且负样本中的容易样本也非常多,这样模型的学习就会被其中大多数的容易负样本所控制,导致实体识别效果不佳。
技术实现思路
有鉴于此,本专利技术的主要目的在于提供一种命名实体识别方法、装置、设备以及介质,可以提高命名实体识别效果。为实现上述目的,本专利技术提供了一种命名实体识别方法,包括:步骤A:将目标句子输入当前的命名实体识别模型,得到所述目标句子中每个字符的标注类型和相应的概率;步骤B:根据所述每个字符的所述标注类型的所述相应的概率依照目标损失函数计算所述每个字符所述标注类型的对应损失值,根据当前所述损失值计算总体损失值,所述目标损失函数提高所述命名实体识别模型对标注类型不确定性高的字符的关注度;步骤C:判断当前所述命名实体识别模型是否达到收敛条件,如果否则进入步骤D,如果是则执行步骤E;步骤D:根据所述总体损失值更新所述 ...
【技术保护点】
1.一种命名实体识别方法,其特征在于,包括:/n步骤A:将目标句子输入当前的命名实体识别模型,得到所述目标句子中每个字符的标注类型和相应的概率;/n步骤B:根据所述每个字符的所述标注类型的所述相应的概率依照目标损失函数计算所述每个字符所述标注类型的对应损失值,根据当前所述损失值计算总体损失值,所述目标损失函数提高所述命名实体识别模型对标注类型不确定性高的字符的关注度;/n步骤C:判断当前所述命名实体识别模型是否达到收敛条件,如果否则进入步骤D,如果是则执行步骤E;/n步骤D:根据所述总体损失值更新所述命名实体识别模型,得到更新后的命名实体识别模型,重新获取目标句子,进入步骤A;/n步骤E:选出当前各所述命名实体识别模型中效果最优的模型作为目标模型,根据所述目标模型对所述目标句子进行实体识别。/n
【技术特征摘要】
1.一种命名实体识别方法,其特征在于,包括:
步骤A:将目标句子输入当前的命名实体识别模型,得到所述目标句子中每个字符的标注类型和相应的概率;
步骤B:根据所述每个字符的所述标注类型的所述相应的概率依照目标损失函数计算所述每个字符所述标注类型的对应损失值,根据当前所述损失值计算总体损失值,所述目标损失函数提高所述命名实体识别模型对标注类型不确定性高的字符的关注度;
步骤C:判断当前所述命名实体识别模型是否达到收敛条件,如果否则进入步骤D,如果是则执行步骤E;
步骤D:根据所述总体损失值更新所述命名实体识别模型,得到更新后的命名实体识别模型,重新获取目标句子,进入步骤A;
步骤E:选出当前各所述命名实体识别模型中效果最优的模型作为目标模型,根据所述目标模型对所述目标句子进行实体识别。
2.根据权利要求1所述的命名实体识别方法,其特征在于,所述目标损失函数为:
其中,p为所述每个字符的所述标注类型的所述相应的概率。
3.根据权利要求2所述的命名实体识别方法,其特征在于,所述判断当前所述命名实体识别模型是否达到收敛条件包括:
判断所述总体损失值是否为当前数值最小的总体损失值,如果否则确定当前所述命名实体识别模型未达到收敛条件,如果是,则判断之后的预设次数中总体损失值的最小值是否不低于当前数值最小的总体损失值,如果是,则确定当前所述命名实体识别模型达到收敛条件,如果否则确定当前所述命名实体识别模型未达到收敛条件。
4.根据权利要求3所述的命名实体识别方法,其特征在于,所述选出当前各所述命名实体识别模型中效果最优的模型作为目标模型包括:
确定所述当前数值最小的总体损失值所对应的命名实体识别模型为当前各所述命名实体识别模型中效果最优的模型。
5.根据权利要求3所述的命名实体识别方法,其特征在于,所述选出当前各所述命名实体识别模型中效果最优的模型作为目标模型包括:
判断之后的所述预设次数中各总体损失值是否均大于所述当前数值最小的总体损失值,如果是,则确定所述当前数值最小的总体损失值所对应的命名实体识别模型为当前各所述命名实体识别模型中效果最优的模型;<...
【专利技术属性】
技术研发人员:韩庆宏,李纪为,
申请(专利权)人:北京香侬慧语科技有限责任公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。