实体识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:33396195 阅读:24 留言:0更新日期:2022-05-11 23:16
本发明专利技术涉及人工智能领域,揭露一种实体识别方法,包括:对待识别文本及实体标签集执行字向量转换处理,得到待识别文本对应的第一字向量特征及实体类别集对应的第二字向量特征;对待识别文本执行编码处理,得到待识别文本对应的编码特征;对编码特征执行解码处理,得到待识别文本对应的解码特征;对解码特征及第一字向量特征执行特征融合处理,得到待识别文本对应的融合特征;对第二字向量特征、解码特征及融合特征执行实体识别处理及标签识别处理,得到实体识别结果。本发明专利技术还提供一种实体识别装置、电子设备及存储介质。本发明专利技术提高了不连续实体及嵌套实体的识别准确性。续实体及嵌套实体的识别准确性。续实体及嵌套实体的识别准确性。

【技术实现步骤摘要】
实体识别方法、装置、电子设备及存储介质


[0001]本专利技术涉及人工智能领域,尤其涉及一种实体识别方法、装置、电子设备及存储介质。

技术介绍

[0002]实体识别任务是自然语言处理领域中的一项重要任务,可广泛用于信息抽取、文本分类等多场景。
[0003]当前,通常采用以下方式进行实体识别:给待识别文本中每个token打一个实体类别标签,一组相邻且实体类别相同的token组成的序列为一个实体。然而,这种方式只能识别连续实体,对于不连续实体及嵌套实体的识别准确度较低。因此,亟需一种实体识别方法,以提高不连续实体及嵌套实体的识别准确度。

技术实现思路

[0004]鉴于以上内容,有必要提供一种实体识别方法,旨在提高不连续实体及嵌套实体的识别准确度。
[0005]本专利技术提供的实体识别方法,包括:
[0006]接收待识别文本,确定所述待识别文本对应的目标领域,获取所述目标领域对应的实体标签集;
[0007]对所述待识别文本及实体标签集分别执行字向量转换处理,得到所述待识别文本对应的第一字向量特征及所述实本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种实体识别方法,其特征在于,所述方法包括:接收待识别文本,确定所述待识别文本对应的目标领域,获取所述目标领域对应的实体标签集;对所述待识别文本及实体标签集分别执行字向量转换处理,得到所述待识别文本对应的第一字向量特征及所述实体类别集对应的第二字向量特征;对所述待识别文本执行编码处理,得到所述待识别文本对应的编码特征;对所述编码特征执行解码处理,得到所述待识别文本对应的解码特征;对所述解码特征及第一字向量特征执行特征融合处理,得到所述待识别文本对应的融合特征;对所述第二字向量特征、解码特征及融合特征执行实体识别处理及标签识别处理,得到实体识别结果。2.如权利要求1所述的实体识别方法,其特征在于,通过实体识别模型的字向量转换网络执行字向量转换处理,通过实体识别模型的编码网络执行编码处理,通过实体识别模型的解码网络执行解码处理,通过实体识别模型的特征提取网络执行特征融合处理,通过实体识别模型的分类网络执行实体识别处理及标签识别处理。3.如权利要求1所述的实体识别方法,其特征在于,所述对所述第二字向量特征、解码特征及融合特征执行实体识别处理及标签识别处理,得到实体识别结果,包括:将所述融合特征与解码特征的点积输入实体识别模型的分类网络执行实体识别处理,得到待生成的目标实体标注序列中每个位置对应的实体分布概率;将所述第二字向量特征与解码特征的点积输入所述分类网络执行标签识别处理,得到待生成的目标实体标注序列中每个位置对应的标签分布概率;根据所述实体分布概率及标签分布概率确定实体识别结果。4.如权利要求3所述的实体识别方法,其特征在于,所述根据所述实体分布概率及标签分布概率确定实体识别结果,包括:选择目标实体标注序列中一个位置对应的实体分布概率及标签分布概率;基于选择的实体分布概率获取选择的位置生成的实体为所述待识别文本中每个字符的概率值;基于选择的标签分布概率获取选择的位置生成的标签为所述实体标签集中每个标签的概率值;将概率值最大的字符或标签作为所述目标实体标注序列中选择的位置对应的目标物;汇总所述目标实体标注序列中每个位置对应的目标物,得到实体识别结果。5.如权利要求1所述的实体识别方法,其特征在于,所述对所述待识别文本及实体标签集分别执行字向量转换处理,得到所述待识别文本对应的第一字向量特征及所述实体类别集对应的第二字向量特征,包括:将所述待识别文本及实体标签集分别输入实体识别模型的字向量转换网络的第一嵌入层执行位置编码,得到每个字符对应的位置向量;将所述待识别文本及实体标签集分别输入所述字向量转换网络的第二嵌入层执行字符编码,得...

【专利技术属性】
技术研发人员:王涵暄许双华
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1