样本处理方法、装置、计算机可读介质及电子设备制造方法及图纸

技术编号：30438223 阅读：8 留言：0更新日期：2021-10-24 17:42

本公开的实施例提供了一种应用于图像区域规划模型训练的样本处理方法、应用于图像区域规划模型训练的样本处理装置、计算机可读介质及电子设备，涉及图像处理技术领域，该方法包括：识别样本图像中各文本框，并根据各文本框确定样本图像对应的图像特征、语义特征以及预设特征并融合，得到样本图像的综合特征；基于样本图像的综合特征和文本框参数确定每两个文本框之间的关系矩阵；根据各文本框的预设标签、样本图像的综合特征和关系矩阵训练图像区域规划模型。可见，实施本申请的技术方案，可以训练得到能划分出图像中需要进行结构化信息提取的有效区域的图像区域规划模型，基于图像区域规划模型可以提升信息提取效率和精度。像区域规划模型可以提升信息提取效率和精度。像区域规划模型可以提升信息提取效率和精度。

全部详细技术资料下载

【技术实现步骤摘要】
样本处理方法、装置、计算机可读介质及电子设备

[0001]本公开涉及图像处理
，具体而言，涉及一种应用于图像区域规划模型训练的样本处理方法、应用于图像区域规划模型训练的样本处理装置、计算机可读介质及电子设备。

技术介绍

[0002]对于图像中文字的提取，一般需要人为手动将照片中的文字输入标准化的列表，以通过结构化信息的方式统一对照片中文字进行标准化存储。但是，人工提取信息通常会存在效率较低的问题。为了解决这个问题，一些厂商设计出自动化提取图像文本信息的模型，用于基于一个提取标准进行自动化的图像文本信息提取，但是，图像中文字排版一般较为多样，通过统一的提取标准也容易造成提取精度较低的问题。
[0003]需要说明的是，在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0004]本公开实施例的目的在于提供一种应用于图像区域规划模型训练的样本处理方法、应用于图像区域规划模型训练的样本处理装置、计算机可读介质及电子设备，可以训练得到能划分出图像中需要进行结构化信息提取的有效区域的图像区域规划模型，基于训练出的图像区域规划模型可以提升针对图像的信息提取效率，并提升结构化信息提取精度，降低对于算力的浪费。
[0005]可以通过训练图像区域规划模型解决人工输入信息效率较低的问题，实现对于结构化信息的自动提取，提升结构化信息提取效率。
[0006]本公开实施例的第一方面提供了一种应用于图像区域规划模型训...

【技术保护点】

【技术特征摘要】
1.一种应用于图像区域规划模型训练的样本处理方法，其特征在于，所述图像区域规划模型用于规划出图像中包含结构化信息的区域，所述方法包括：识别样本图像中各文本框，并根据所述各文本框确定所述样本图像对应的图像特征、语义特征以及预设特征；将所述样本图像对应的图像特征、语义特征以及预设特征进行融合，得到所述样本图像的综合特征；根据所述各文本框在所述样本图像中的位置确定用于表征所述各文本框之间位置关系的文本框参数，并基于所述样本图像的综合特征和所述文本框参数确定每两个文本框之间的关系矩阵；根据所述各文本框的预设标签、所述样本图像的综合特征和每两个文本框之间的关系矩阵训练所述图像区域规划模型。2.根据权利要求1所述的方法，其特征在于，根据所述各文本框的预设标签、所述样本图像的综合特征和每两个文本框之间的关系矩阵训练所述图像区域规划模型之后，所述方法还包括：根据训练后的图像区域规划模型对接收到的待处理图像进行区域划分，得到区域规划结果；根据所述区域规划结果提取所述待处理图像中各区域的文本信息；其中，所述文本信息包括字段和字段内容中至少一种；根据所述文本信息生成所述待处理图像对应的结构化信息。3.根据权利要求1所述的方法，其特征在于，根据所述各文本框确定所述样本图像对应的图像特征，包括：通过所述图像区域规划模型中的图像特征提取网络提取所述各文本框分别对应的子图像特征；根据所述子图像特征构建所述样本图像对应的图像特征。4.根据权利要求1所述的方法，其特征在于，根据所述各文本框确定所述样本图像对应的语义特征，包括：确定所述各文本框在所述样本图像中的位置信息；将所述位置信息输入所述图像区域规划模型中的语义特征提取网络，以使得所述语义特征提取网络根据所述位置信息提取所述各文本框分别对应的子语义特征；根据所述子语义特征构建所述样本图像对应的语义特征。5.根据权利要求1所述的方法，其特征在于，根据所述各文本框确定所述样本图像对应的预设特征，包括：对所述各文本框进行包含关系判定，得到每个文本框对应的多个判定结果；根据每个文本框对应的多个判定结果构建所述样本图像的预设特征；其中，所述包含关系判定包括以下至少一种：判定对应的文本...

【专利技术属性】
技术研发人员：刘昊岳，肖杨，付晓，刘设伟，
申请(专利权)人：泰康在线财产保险股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人