【技术实现步骤摘要】
嵌套实体识别模型的训练方法、嵌套实体识别方法及装置
[0001]本申请实施例涉及人工智能
,特别涉及一种嵌套实体识别模型的训练方法、嵌套实体识别方法及装置。
技术介绍
[0002]自然语言分析是一项重要的技术,涵盖信息检索、信息抽取、自然语言问答等
,其中,实体识别技术是自然语言分析中的重要组成部分,实体识别技术是一种识别实体的实体类型的技术。
[0003]相关技术中,实体可以为嵌套实体。嵌套实体的内部嵌套有至少一个实体,因此,嵌套实体对应至少一个内部实体和一个外部实体,也就是说,嵌套实体对应至少两个子实体。例如,对于嵌套实体“慢性扁桃体炎”,其内部实体为“扁桃体”和“扁桃体炎”,外部实体为“慢性扁桃体炎”,因此,嵌套实体“慢性扁桃体炎”对应三个子实体“扁桃体”、“扁桃体炎”和“慢性扁桃体炎”。由于嵌套实体对应至少两个子实体,导致识别嵌套实体的实体类型较为困难,因此,亟需一种嵌套实体识别模型来准确的识别嵌套实体的实体类型。
技术实现思路
[0004]本申请实施例提供了一种嵌套实体识别模型的 ...
【技术保护点】
【技术特征摘要】
1.一种嵌套实体识别模型的训练方法,其特征在于,所述方法包括:获取多个第一嵌套实体的标签信息,所述第一嵌套实体的标签信息包括所述第一嵌套实体中各个字符的第一标签、所述第一嵌套实体中各个字符的第二标签以及所述第一嵌套实体的各个子实体的第三标签,所述字符的第一标签表征所述字符是否为子实体的开始字符,所述字符的第二标签表征所述字符是否为子实体的结尾字符,所述子实体的第三标签表征所述子实体的实体类型;对于任一第一嵌套实体,根据第一网络模型确定所述任一第一嵌套实体的第一预测信息,所述任一第一嵌套实体的第一预测信息包括所述任一第一嵌套实体中各个字符为子实体的开始字符的第一概率、所述任一第一嵌套实体中各个字符为子实体的结尾字符的第一概率以及所述任一第一嵌套实体的各个子实体的第一实体类型概率;基于所述多个第一嵌套实体的标签信息和第一预测信息,对所述第一网络模型进行训练,得到第二网络模型;响应于满足第一条件,将所述第二网络模型作为嵌套实体识别模型,所述嵌套实体识别模型用于对嵌套实体的实体类型进行识别。2.根据权利要求1所述的方法,其特征在于,所述根据第一网络模型确定所述任一第一嵌套实体的第一预测信息,包括:根据第一网络模型,确定所述任一第一嵌套实体中各个字符为子实体的开始字符的第一概率和所述任一第一嵌套实体中各个字符为子实体的结尾字符的第一概率;根据所述第一网络模型,基于所述任一第一嵌套实体中各个字符为子实体的开始字符的第一概率和所述任一第一嵌套实体中各个字符为子实体的结尾字符的第一概率确定所述任一第一嵌套实体的各个子实体;根据所述第一网络模型,确定所述任一第一嵌套实体的各个子实体的第一实体类型概率。3.根据权利要求2所述的方法,其特征在于,所述确定所述任一第一嵌套实体的各个子实体的第一实体类型概率,包括:对于所述任一第一嵌套实体的任一子实体,基于所述任一子实体的开始字符的字符特征和所述任一子实体的结尾字符的字符特征,确定所述任一子实体的子实体特征;基于所述任一子实体的子实体特征,确定所述任一子实体的第一实体类型概率。4.根据权利要求3所述的方法,其特征在于,所述基于所述任一子实体的开始字符的字符特征和所述任一子实体的结尾字符的字符特征,确定所述任一子实体的子实体特征,包括:基于所述任一子实体的开始字符的字符特征和所述任一子实体的结尾字符的字符特征,确定字符关系特征,所述字符关系特征用于表征所述任一子实体的开始字符与所述任一子实体的结尾字符之间的字符关系;基于所述任一子实体的开始字符的字符特征、所述任一子实体的结尾字符的字符特征和所述字符关系特征,确定所述任一子实体的子实体特征。5.根据权利要求4所述的方法,其特征在于,所述字符关系特征包括字符差异特征,所述字符差异特征用于表征所述任一子实体的开始字符与所述任一子实体的结尾字符之间的字符差异;
所述基于所述任一子实体的开始字符的字符特征和所述任一子实体的结尾字符的字符特征,确定字符关系特征,包括:确定所述任一子实体的开始字符的字符特征和所述任一子实体的结尾字符的字符特征之间的差值,得到字符差异特征。6.根据权利要求4所述的方法,其特征在于,所述字符关系特征包括字符相似特征,所述字符相似特征用于表征所述任一子实体的开始字符与所述任一子实体的结尾字符之间的字符相似度;所述基于所述任一子实体的开始字符的字符特征和所述任一子实体的结尾字符的字符特征,确定字符关系特征,包括:确定所述任一子实体的开始字符的字符特征和所述任一子实体的结尾字符的字符特征之间的点积,得到字符相似特征。7.根据权利要求1所述的方法,其特征在于,所述基于所述多个第一嵌套实体的标签信息和第一预测信息,对所述第一网络模型进行训练,得到第二网络模型,包括:对于任一第一嵌套实体,基于所述任一第一嵌套实体的标签信息和第一预测信息,确定所述任一第一嵌套实体的损失值;基于所述多个第一嵌套实体的损失值,对所述第一网络模型进行训练,得到第二网络模型。8.根据权利要求7所述的方法,其特征在于,所述基于所述任一第一嵌套实体的标签信息和第一预测信息,确定所述任一第一嵌套实体的损失值,包括:基于所述任一第一嵌套实体中各个字符的第一标签和所述任一第一嵌套实体中各个字符为子实体的开始字符的第一概率,确定所述任一第一嵌套实体的第一损失值;基于所述任一第一嵌套实体中各个字符的第二标签和所述任一第一嵌套实体中各个字符为子实体的结尾字符的第一概率,确定所述任一第一嵌套实体的第二损失值;基于所述任一第一嵌套实体的各个子实体的第三标签和所述任一第一嵌套实体的各个子实体的第一实体类型概率,确定所述任一第一嵌套实体的第三损失值;基于所述任一第一嵌套实体的第一损失值、第二损失值以及第三损失值,确定所述任一第一嵌套实体的损失值。9.根据权利要求1所述的方法,其特征在于,所述方法还包括:响应于不满足所述第一条件,对于任一第一嵌套实体,根据所述第二网络模型确定所述任一第一嵌套实体的第二预测信息,所述任一第一嵌套实体的第二预测信息包括所述任一第一嵌套实体中各个字符为子实体的开始字符的第二概率、所述任一第一嵌套实体中各个字符为子实体的结尾字符的第二概率以及所述任一第一嵌套实体的各个子实体的第二实体类型概率;基于所述多个第一嵌套实体的标签信息和第二预测信息,对所述第二网络模型进行训练,得到第三网络模型;响应于满足所述第一条件,将所述第三网络模型作为所述嵌套实体识别模型。10.根据权利要求1至9任一所述的方法,其特征在于,所述基于所述多个第一嵌套实体的标签信息和第一预测信息,对所述第一网络模型进行训练,得到第二网络模型之前,还包括:
获取多个第二嵌套实体的标签信息,所述第二嵌套实体的标签信息包括所述第二嵌套实体中各个字符的第一标签、所述第二嵌套实体中各个字符的第二标签以及所述第二嵌套实体的各个子实体的第三标签;对于任一第二嵌套实体,根据所述第一网络模型确定...
【专利技术属性】
技术研发人员:谢润泉,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。