一种命名实体识别方法、装置、设备以及介质制造方法及图纸

技术编号:24800212 阅读:30 留言:0更新日期:2020-07-07 21:09
本发明专利技术公开了应用本发明专利技术提供的一种命名实体识别方法、装置、设备以及介质,将目标句子输入当前的命名实体识别模型,得到每个字符的标注类型和相应的概率;根据每个字符的标注类型的相应概率依照目标损失函数计算对应损失值,根据当前所述损失值计算总体损失值,目标损失函数提高所述命名实体识别模型对标注类型不确定性高的字符的关注度;判断当前所述命名实体识别模型是否达到收敛条件,如果否则选出当前效果最优的模型作为目标模型对目标句子进行实体识别,如果是则根据所述总体损失值更新所述命名实体识别模型,得到更新后的命名实体识别模型,循环前述步骤直到判断模型达到收敛条件,可以提高命名实体识别的准确率。

【技术实现步骤摘要】
一种命名实体识别方法、装置、设备以及介质
本专利技术涉及计算机
,特别是涉及一种命名实体识别方法、装置、设备以及介质。
技术介绍
命名实体识别是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。为了在命名体识别任务上得到更准确的结果,即对一句话中可能的命名实体(如人名、地名、机构名等)进行识别,传统方法将词表中的每一个词根据编号映射为一个词向量,并通过一些编码器将整句话中的词向量进行编码,最终预测每一个词所属的标签。但是,在一句话中,实体所占字符只占全部字符的少数,大部分的字符需要被模型标注为“负样本”,而且负样本中的容易样本也非常多,这样模型的学习就会被其中大多数的容易负样本所控制,导致实体识别效果不佳。
技术实现思路
有鉴于此,本专利技术的主要目的在于提供一种命名实体识别方法、装置、设备以及介质,可以提高命名实体识别效果。为实现上述目的,本专利技术提供了一种命名实体识别方法,包括:步骤A:将目标句子输入当前的命名实体识别模型,得到所述目标句子中每个字符的标注类型和相应的概率;步骤B:根据所述每个字符的所述标注类型的所述相应的概率依照目标损失函数计算所述每个字符所述标注类型的对应损失值,根据当前所述损失值计算总体损失值,所述目标损失函数提高所述命名实体识别模型对标注类型不确定性高的字符的关注度;步骤C:判断当前所述命名实体识别模型是否达到收敛条件,如果否则进入步骤D,如果是则执行步骤E;步骤D:根据所述总体损失值更新所述命名实体识别模型,得到更新后的命名实体识别模型,重新获取目标句子,进入步骤A;步骤E:选出当前各所述命名实体识别模型中效果最优的模型作为目标模型,根据所述目标模型对所述目标句子进行实体识别。优选地,所述目标损失函数为:其中,p为所述每个字符的所述标注类型的所述相应的概率。优选地,所述判断当前所述命名实体识别模型是否达到收敛条件包括:判断所述总体损失值是否为当前数值最小的总体损失值,如果否则确定当前所述命名实体识别模型未达到收敛条件,如果是,则判断之后的预设次数中总体损失值的最小值是否不低于当前数值最小的总体损失值,如果是,则确定当前所述命名实体识别模型达到收敛条件,如果否则确定当前所述命名实体识别模型未达到收敛条件。优选地,所述选出当前各所述命名实体识别模型中效果最优的模型作为目标模型包括:确定所述当前数值最小的总体损失值所对应的命名实体识别模型为当前各所述命名实体识别模型中效果最优的模型。优选地,所述选出当前各所述命名实体识别模型中效果最优的模型作为目标模型包括:判断之后的所述预设次数中各总体损失值是否均大于所述当前数值最小的总体损失值,如果是,则确定所述当前数值最小的总体损失值所对应的命名实体识别模型为当前各所述命名实体识别模型中效果最优的模型;如果否,则判断之后的所述预设次数中最小的总体损失值是否等于所述当前数值最小的总体损失值,如果是,则确定所述预设次数中最后出现的最小的总体损失值所对应的命名实体识别模型为当前各所述命名实体识别模型中效果最优的模型。本专利技术还提供了一种命名实体识别装置,包括:标注模块,用于将目标句子输入当前的命名实体识别模型,得到所述目标句子中每个字符的标注类型和相应的概率;损失值获取模块,用于根据所述每个字符的所述标注类型的所述相应的概率依照目标损失函数计算所述每个字符所述标注类型的对应损失值,根据当前所述损失值计算总体损失值,所述目标损失函数提高所述命名实体识别模型对标注类型不确定性高的字符的关注度;收敛判断模块,用于判断当前所述命名实体识别模型是否达到收敛条件;模型更新模块,用于根据所述总体损失值更新所述命名实体识别模型,得到更新后的命名实体识别模型,重新获取目标句子;目标模型确定模块,用于选出当前各所述命名实体识别模型中效果最优的模型作为目标模型,根据所述目标模型对所述目标句子进行实体识别。优选地,所述目标损失函数为:其中,p为所述每个字符的所述标注类型的所述相应的概率。优选地,所述收敛判断模块具体用于:判断所述总体损失值是否为当前数值最小的总体损失值,如果否则确定当前所述命名实体识别模型未达到收敛条件,如果是,则判断之后的预设次数中总体损失值的最小值是否不低于当前数值最小的总体损失值,如果是,则确定当前所述命名实体识别模型达到收敛条件,如果否则确定当前所述命名实体识别模型未达到收敛条件。本专利技术还提供了一种命名实体识别设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现以上任一项所述命名实体识别方法的步骤。本专利技术还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现以上任一项所述命名实体识别方法的步骤。应用本专利技术提供的一种命名实体识别方法、装置、设备以及介质,将目标句子输入当前的命名实体识别模型,得到所述目标句子中每个字符的标注类型和相应的概率;根据所述每个字符的所述标注类型的所述相应的概率依照目标损失函数计算所述每个字符所述标注类型的对应损失值,根据当前所述损失值计算总体损失值,所述目标损失函数提高所述命名实体识别模型对标注类型不确定性高的字符的关注度;判断当前所述命名实体识别模型是否达到收敛条件,如果是,则选出当前各所述命名实体识别模型中效果最优的模型作为目标模型,根据所述目标模型对所述目标句子进行实体识别,否则根据所述总体损失值更新所述命名实体识别模型,得到更新后的命名实体识别模型,循环步骤直到判断模型达到收敛条件,可以通过命名实体识别标注得到的字符标注类型的概率直接计算损失函数得到损失值,在损失值未达到标准时不断更新命名实体识别模型,使得模型的损失值更优,减少容易样本的学习权重,增大困难样本的贡献权重,从而能够很好地在命名实体识别任务中缓解数据不平衡问题,提高命名实体识别的准确率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为申请实施例公开的一种命名实体识别方法的流程图;图2为申请实施例公开的一种命名实体识别方法的示例图;图3为申请实施例公开的一种命名实体识别方法的损失函数图;图4为申请实施例公开的又一种命名实体识别方法的流程图;图5为申请实施例公开的又一种命名实体识别方法的流程图;图6为申请实施例公开的一种命名实体识别装置的结构示意图;图7为本专利技术实施例公开的命名实体识别设备的结构框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅本文档来自技高网...

【技术保护点】
1.一种命名实体识别方法,其特征在于,包括:/n步骤A:将目标句子输入当前的命名实体识别模型,得到所述目标句子中每个字符的标注类型和相应的概率;/n步骤B:根据所述每个字符的所述标注类型的所述相应的概率依照目标损失函数计算所述每个字符所述标注类型的对应损失值,根据当前所述损失值计算总体损失值,所述目标损失函数提高所述命名实体识别模型对标注类型不确定性高的字符的关注度;/n步骤C:判断当前所述命名实体识别模型是否达到收敛条件,如果否则进入步骤D,如果是则执行步骤E;/n步骤D:根据所述总体损失值更新所述命名实体识别模型,得到更新后的命名实体识别模型,重新获取目标句子,进入步骤A;/n步骤E:选出当前各所述命名实体识别模型中效果最优的模型作为目标模型,根据所述目标模型对所述目标句子进行实体识别。/n

【技术特征摘要】
1.一种命名实体识别方法,其特征在于,包括:
步骤A:将目标句子输入当前的命名实体识别模型,得到所述目标句子中每个字符的标注类型和相应的概率;
步骤B:根据所述每个字符的所述标注类型的所述相应的概率依照目标损失函数计算所述每个字符所述标注类型的对应损失值,根据当前所述损失值计算总体损失值,所述目标损失函数提高所述命名实体识别模型对标注类型不确定性高的字符的关注度;
步骤C:判断当前所述命名实体识别模型是否达到收敛条件,如果否则进入步骤D,如果是则执行步骤E;
步骤D:根据所述总体损失值更新所述命名实体识别模型,得到更新后的命名实体识别模型,重新获取目标句子,进入步骤A;
步骤E:选出当前各所述命名实体识别模型中效果最优的模型作为目标模型,根据所述目标模型对所述目标句子进行实体识别。


2.根据权利要求1所述的命名实体识别方法,其特征在于,所述目标损失函数为:



其中,p为所述每个字符的所述标注类型的所述相应的概率。


3.根据权利要求2所述的命名实体识别方法,其特征在于,所述判断当前所述命名实体识别模型是否达到收敛条件包括:
判断所述总体损失值是否为当前数值最小的总体损失值,如果否则确定当前所述命名实体识别模型未达到收敛条件,如果是,则判断之后的预设次数中总体损失值的最小值是否不低于当前数值最小的总体损失值,如果是,则确定当前所述命名实体识别模型达到收敛条件,如果否则确定当前所述命名实体识别模型未达到收敛条件。


4.根据权利要求3所述的命名实体识别方法,其特征在于,所述选出当前各所述命名实体识别模型中效果最优的模型作为目标模型包括:
确定所述当前数值最小的总体损失值所对应的命名实体识别模型为当前各所述命名实体识别模型中效果最优的模型。


5.根据权利要求3所述的命名实体识别方法,其特征在于,所述选出当前各所述命名实体识别模型中效果最优的模型作为目标模型包括:
判断之后的所述预设次数中各总体损失值是否均大于所述当前数值最小的总体损失值,如果是,则确定所述当前数值最小的总体损失值所对应的命名实体识别模型为当前各所述命名实体识别模型中效果最优的模型;<...

【专利技术属性】
技术研发人员:韩庆宏李纪为
申请(专利权)人:北京香侬慧语科技有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1