针对图像的信息提取方法、装置、介质及电子设备制造方法及图纸

技术编号：30438238 阅读：15 留言：0更新日期：2021-10-24 17:42

本公开的实施例提供了一种针对图像的信息提取方法、针对图像的信息提取装置、计算机可读介质及电子设备，涉及信息识别技术领域，该方法包括：识别目标图像中的文本框，并根据文本框中包含关键词的目标文本框拟合用于对目标图像进行区域划分的直线；根据直线将目标图像划分为多个图像区域；对多个图像区域中各图像区域的文本框进行字段识别和字段信息识别，得到各图像区域中相对应的字段和字段信息；根据各图像区域中相对应的字段和字段信息生成与目标图像对应的结构化信息。可见，实施本申请的技术方案，可以提升结构化信息提取精度和结构化信息提取效率。度和结构化信息提取效率。度和结构化信息提取效率。

全部详细技术资料下载

【技术实现步骤摘要】
针对图像的信息提取方法、装置、介质及电子设备

[0001]本公开涉及信息识别
，具体而言，涉及一种针对图像的信息提取方法、针对图像的信息提取装置、计算机可读介质及电子设备。

技术介绍

[0002]对于易失性的书面文字，一般可以采用照片的方式进行记录。为了对照片中的文字进行统一管理和存储，一般需要人为手动将照片中的文字输入标准化的列表，以通过结构化信息的方式统一对照片中文字进行标准化存储。但是，人工输入信息通常会存在效率较低的问题。
[0003]需要说明的是，在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0004]本公开实施例的目的在于提供一种针对图像的信息提取方法、针对图像的信息提取装置、计算机可读介质及电子设备，可以通过对图像的区域划分实现对于结构化信息的自动提取，提升结构化信息的提取效率。
[0005]本公开实施例的第一方面提供了一种针对图像的信息提取方法，该方法包括：
[0006]识别目标图像中的文本框，并根据文本框中包含关键词的目标文本框拟合用于对目标图像进行区域划分的直线；
[0007]根据直线将目标图像划分为多个图像区域；
[0008]对多个图像区域中各图像区域的文本框进行字段识别和字段信息识别，得到各图像区域中相对应的字段和字段信息；
[0009]根据各图像区域中相对应的字段和字段信息生成与目标图像对应的结构化信息。
[0010]根据本...

【技术保护点】

【技术特征摘要】
1.一种针对图像的信息提取方法，其特征在于，包括：识别目标图像中的文本框，并根据所述文本框中包含关键词的目标文本框拟合用于对所述目标图像进行区域划分的直线；根据所述直线将所述目标图像划分为多个图像区域；对所述多个图像区域中各图像区域的文本框进行字段识别和字段信息识别，得到所述各图像区域中相对应的字段和字段信息；根据所述各图像区域中相对应的字段和字段信息生成与所述目标图像对应的结构化信息。2.根据权利要求1所述的方法，其特征在于，根据所述文本框中包含关键词的目标文本框拟合用于对所述目标图像进行区域划分的直线，包括：从所述文本框中确定命中预设词库中关键词的至少一类目标文本框；其中，每一类目标文本框中的目标文本框数量为至少一个；确定所述至少一类目标文本框中每个目标文本框的位置信息；根据所述位置信息确定所述每一类目标文本框对应的直线；其中，所述每一类目标文本框对应的直线均用于对所述目标图像进行区域划分。3.根据权利要求2所述的方法，其特征在于，根据所述位置信息确定所述每一类目标文本框对应的直线，包括：根据所述位置信息确定类内目标文本框的中心点，并根据类内目标文本框的中心点确定所述每一类目标文本框对应的直线；其中，所述每一类目标文本框对应的直线用于连接类内目标文本框的中心点；或者，根据所述位置信息确定类内目标文本框的边界斜率，并根据类内目标文本框的边界斜率确定所述每一类目标文本框对应的直线；其中，所述每一类目标文本框对应的直线用于贯穿类内目标文本框，所述边界斜率包括上边界斜率和下边界斜率中至少一种。4.根据权利要求1所述的方法，其特征在于，所述多个图像区域包括明细区域、头部区域和尾部区域，所述明细区域中的字段与字段信息之间为一对一关系或一对多关系，所述头部区域中的字段和字段信息之间为一对一关系，所述尾部区域中的字段和字段信息之间为一对一关系。5.根据权利要求1所述的方法，其特征在于，对所述多个图像区域中各图像区域的文本框进行字段识别和字段信息识别，包括：通过预训练的分类器计算目标图像区域中的文本框相对于所述目标图像中边框的直线距离特征；其中，所述目标图像区域为所述多个图像区域中任一图像区域；通过所述分类器计算所述目标图像区域中各文本框相对于所述目标图像区域中各字段的水平距离特征；通过所述分类器对所述目标图像区域中各文本框进行特定对象识别，得到对象识别结果；其中，所述特定对象包括符号、数字、字中至少一种；通过所述分类器对所述目标图像区域中各文本框进行定向投影，得到...

【专利技术属性】
技术研发人员：刘昊岳，王亚领，马文伟，刘设伟，
申请(专利权)人：泰康在线财产保险股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人