实体识别方法和实体识别模型的训练方法技术

技术编号：38368881 阅读：10 留言：0更新日期：2023-08-05 17:33

本说明书实施例提供实体识别方法和实体识别模型的训练方法，其中所述实体识别方法包括：获取目标图像；将所述目标图像输入实体识别模型，获得所述目标图像的实体识别结果，其中，所述实体识别模型为基于样本图像与样本文本之间的特征对齐预先训练得到，所述样本文本从所述样本图像中识别得到。通过将目标图像输入实体识别模型，从而使实体识别模型可以完成对目标图像的实体抽取；实体识别模型为基于样本图像和样本文本之间的特征对象进行预先训练得到，从而使得实体识别模型具备语义分析功能，进而可以获得符合需求的实体识别结果，提升实体识别效率和准确度。升实体识别效率和准确度。升实体识别效率和准确度。

全部详细技术资料下载

【技术实现步骤摘要】
实体识别方法和实体识别模型的训练方法

[0001]本说明书实施例涉及计算机
，特别涉及实体识别方法和实体识别模型的训练方法。

技术介绍

[0002]随着计算机技术的不断发展，图像处理技术也在不断提升。
[0003]目前，为了可以对图像内容进行检测和识别，通常基于图像识别算法直接识别出图像中包含的内容。即通常针对于包含清晰实体内容的图像，例如，文档扫描的场景等仅包含一种类型实体的图像；而对于较为复杂的图像，例如，自然场景图像，图像中的文字可能会在折叠、扭曲等情况，影响对图像的识别效果以及识别效率。
[0004]因此，如何提升对图像的识别和检测效率，获得结构化的实体内容成为本领域技术人员亟待解决的技术问题。

技术实现思路

[0005]有鉴于此，本说明书实施例提供了实体识别方法。本说明书一个或者多个实施例同时涉及实体识别模型的训练方法、文档实体识别方法以及实体识别装置，一种计算设备，一种计算机可读存储介质以及一种计算机程序，以解决现有技术中存在的技术缺陷。
[0006]根据本说明书实施例的第一方面，提供了一种实体识别方法，包括：
[0007]获取目标图像；
[0008]将所述目标图像输入实体识别模型，获得所述目标图像的实体识别结果，其中，所述实体识别模型为基于样本图像与样本文本之间的特征对齐预先训练得到，所述样本文本从所述样本图像中识别得到。
[0009]根据本说明书实施例的第二方面，提供了一种实体识别模型的训练方法，应用于云侧设备，包括：
[0...

【技术保护点】

【技术特征摘要】
1.一种实体识别方法，包括：获取目标图像；将所述目标图像输入实体识别模型，获得所述目标图像的实体识别结果，其中，所述实体识别模型为基于样本图像与样本文本之间的特征对齐预先训练得到，所述样本文本从所述样本图像中识别得到。2.如权利要求1所述的方法，所述实体识别模型包含实体位置层、实体类别层、实现关系层、特征转换层和特征提取层；将所述目标图像输入实体识别模型，获得所述目标图像的实体识别结果，包括：将所述目标图像输入所述特征提取层，获得所述特征提取层输出的目标图像特征；将所述目标图像特征输入所述实体位置层，获得所述实体位置层检测到的实体位置信息；将所述目标图像特征和所述实体位置信息输入所述特征转换层，获得所述特征转换层输出的目标实体特征；将所述目标实体特征分别输入所述实体类别层和实体关系层，获得所述实体类别层输出的实体类别以及所述实体关系层输出的实体关系；将所述实体位置信息、所述实体类别和所述实体关系作为所述目标图像的实体识别结果。3.如权利要求2所述的方法，将所述目标图像特征和所述实体位置信息输入所述特征转换层，获得所述特征转换层输出的目标实体特征，包括：将所述目标图像特征和所述实体位置信息输入所述特征转换层；基于所述实体位置信息确定所述目标图像中实体的实体中心信息；基于所述实体中心信息在所述目标图像特征中抽取目标图像向量，并根据所述目标图像向量生成实体中心特征；根据所述实体中心特征和目标语义特征生成目标实体特征。4.如权利要求1所述的方法，将所述目标图像输入实体识别模型，获得所述目标图像的实体识别结果之前，还包括：获取样本图像，其中，所述样本图像携带有样本文本和样本位置；将所述样本图像输入所述实体识别模型，基于所述样本位置，提取所述样本图像的图像特征，并根据所述样本文本，提取文本特征；将所述图像特征与所述文本特征进行比对，获得比对结果；根据所述比对结果，确定模型损失值，并基于所述模型损失值对所述实体识别模型进行训练，直至达到模型训练停止条件。5.如权利要求4所述的方法，获取样本图像之前，还包括：提取所述样本图像中的样本图像特征；基于所述样本图像特征对所述样本图像中的文本框进行识别，确定样本文本和所述样本文本对应的样本位置；统计所述样本文本中的目标实体字段，确定所述样本图像中实体对应的样本类别；根据实体对应的样本位置和样本类别，确定实体之间的样本关系。6.如权利要求4或5所述的方法，基于所述样本位置，提取所述样本图像的图像特征，并
根据所述样本文本，提取文本特征，包括：提取所述样本图像的样本图像特征；根据所述样本位置确定所述样本图像中实体的实体中心信息；基于所述实体中心信息在所述样本图像的样本图像特征中提取样本图像向量，根据所述样本图像向量生成图像特征；将所述样本文本输入目标...

【专利技术属性】
技术研发人员：龙如蛟，王鹏飞，杨志博，姚聪，
申请(专利权)人：阿里巴巴中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人