命名实体识别方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:43712858 阅读:28 留言:0更新日期:2024-12-18 21:26
本申请涉及自然语言处理领域,提供了一种命名实体识别方法、装置、计算机设备及存储介质,该方法包括:获取待识别的目标文本以及目标文本对应的目标图像;通过文本编码网络对目标文本进行编码,得到目标文本特征,通过多头注意力网络对目标文本特征进行网格化处理,得到目标类图像特征;通过特征提取网络对目标图像进行特征提取,得到目标图像特征,目标类图像特征与目标图像特征的表现形式相同;通过特征融合层对目标类图像特征和目标图像特征进行融合,通过实体识别层对融合后的特征进行实体识别,得到实体识别结果。该方法提高了多模态命名实体识别的准确性。

【技术实现步骤摘要】

本申请涉及自然语言处理,尤其涉及一种命名实体识别方法、装置、计算机设备及存储介质


技术介绍

1、命名实体识别是自然语言处理的一个基本问题,其目的在于发现文本中的命名实体以及将命名实体划分到预定义的类别,如人名、地名或组织机构名等。随着数据量的不断增大和数据形式的多样化,单一的文本数据处理已经无法满足复杂场景下的需求,因此,多模态命名实体识别技术应运而生。

2、目前,传统的多模态命名实体识别的主流研究趋势是如何有效地整合来自不同模态的信息。当前多采用基于注意力机制的双流结构,一个流处理图像,一个流处理文本,然后通过注意力层进行特征对齐和融合,最后用序列标注的方法来识别实体。但是,这些方法存在图像特征与文本特征的对齐较差的问题,无法保证复杂场景的命名实体识别的精度。

3、例如,在保险理赔场景下,传统的多模态命名实体识别无法精准地识别出患者上传的病历、检查单等医疗文本以及对应的医疗图片所包含的实体。又例如,在医疗健康领域,传统的多模态命名实体识别无法精准地识别出病历文本数据以及对应的医学影像数据所包含的实体。因此,如何提高多模态命名实体本文档来自技高网...

【技术保护点】

1.一种命名实体识别方法,其特征在于,应用于计算机设备,所述计算机设备部署有目标实体识别模型,所述目标实体识别模型包括文本编码网络、多头注意力网络、特征提取网络、特征融合层和实体识别层,所述方法包括:

2.根据权利要求1所述的命名实体识别方法,其特征在于,所述多头注意力网络包括多头注意力层和第一多层感知机层,所述通过所述多头注意力网络对所述目标文本特征进行网格化处理,得到目标类图像特征,包括:

3.根据权利要求2所述的命名实体识别方法,其特征在于,所述多头注意力层的权重参数包括Query权重矩阵和Key权重矩阵,所述多头注意力层的偏置参数包括Query偏置向量和K...

【技术特征摘要】

1.一种命名实体识别方法,其特征在于,应用于计算机设备,所述计算机设备部署有目标实体识别模型,所述目标实体识别模型包括文本编码网络、多头注意力网络、特征提取网络、特征融合层和实体识别层,所述方法包括:

2.根据权利要求1所述的命名实体识别方法,其特征在于,所述多头注意力网络包括多头注意力层和第一多层感知机层,所述通过所述多头注意力网络对所述目标文本特征进行网格化处理,得到目标类图像特征,包括:

3.根据权利要求2所述的命名实体识别方法,其特征在于,所述多头注意力层的权重参数包括query权重矩阵和key权重矩阵,所述多头注意力层的偏置参数包括query偏置向量和key偏置向量,所述通过所述多头注意力层对所述目标文本特征进行网格化处理,得到初始类图像特征,包括:

4.根据权利要求1所述的命名实体识别方法,其特征在于,所述特征提取网络包括卷积层和第二多层感知机层,所述通过所述特征提取网络对所述目标图像进行特征提取,得到目标图像特征,包括:

5.根据权利要求1所述的命名实体识别方法,其特征在于,所述文本编码网络包括bert模型、bil...

【专利技术属性】
技术研发人员:唐小初龚述涛舒畅陈又新
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1