针对图像的信息提取方法、装置、介质及电子设备制造方法及图纸

技术编号:30438238 阅读:15 留言:0更新日期:2021-10-24 17:42
本公开的实施例提供了一种针对图像的信息提取方法、针对图像的信息提取装置、计算机可读介质及电子设备,涉及信息识别技术领域,该方法包括:识别目标图像中的文本框,并根据文本框中包含关键词的目标文本框拟合用于对目标图像进行区域划分的直线;根据直线将目标图像划分为多个图像区域;对多个图像区域中各图像区域的文本框进行字段识别和字段信息识别,得到各图像区域中相对应的字段和字段信息;根据各图像区域中相对应的字段和字段信息生成与目标图像对应的结构化信息。可见,实施本申请的技术方案,可以提升结构化信息提取精度和结构化信息提取效率。度和结构化信息提取效率。度和结构化信息提取效率。

【技术实现步骤摘要】
针对图像的信息提取方法、装置、介质及电子设备


[0001]本公开涉及信息识别
,具体而言,涉及一种针对图像的信息提取方法、针对图像的信息提取装置、计算机可读介质及电子设备。

技术介绍

[0002]对于易失性的书面文字,一般可以采用照片的方式进行记录。为了对照片中的文字进行统一管理和存储,一般需要人为手动将照片中的文字输入标准化的列表,以通过结构化信息的方式统一对照片中文字进行标准化存储。但是,人工输入信息通常会存在效率较低的问题。
[0003]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0004]本公开实施例的目的在于提供一种针对图像的信息提取方法、针对图像的信息提取装置、计算机可读介质及电子设备,可以通过对图像的区域划分实现对于结构化信息的自动提取,提升结构化信息的提取效率。
[0005]本公开实施例的第一方面提供了一种针对图像的信息提取方法,该方法包括:
[0006]识别目标图像中的文本框,并根据文本框中包含关键词的目标文本框拟合用于对目标图像进行区域划分的直线;
[0007]根据直线将目标图像划分为多个图像区域;
[0008]对多个图像区域中各图像区域的文本框进行字段识别和字段信息识别,得到各图像区域中相对应的字段和字段信息;
[0009]根据各图像区域中相对应的字段和字段信息生成与目标图像对应的结构化信息。
[0010]根据本公开实施例的第二方面,提供一种针对图像的信息提取装置,该装置包括:
[0011]文本框识别单元,用于识别目标图像中的文本框;
[0012]直线拟合单元,用于根据文本框中包含关键词的目标文本框拟合用于对目标图像进行区域划分的直线;
[0013]图像区域划分单元,用于根据直线将目标图像划分为多个图像区域;
[0014]信息识别单元,用于对多个图像区域中各图像区域的文本框进行字段识别和字段信息识别,得到各图像区域中相对应的字段和字段信息;
[0015]结构化信息生成单元,用于根据各图像区域中相对应的字段和字段信息生成与目标图像对应的结构化信息。
[0016]根据本公开实施例的第三方面,提供了一种计算机可读介质,其上存储有计算机程序,程序被处理器执行时实现如上述实施例中第一方面的针对图像的信息提取方法。
[0017]根据本公开实施例的第四方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行时,使得
一个或多个处理器实现如上述实施例中第一方面的针对图像的信息提取方法。
[0018]根据本申请的第五方面,提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述的各种可选实现方式中提供的方法。
[0019]本公开实施例提供的技术方案可以包括以下有益效果:
[0020]在本公开的一些实施例所提供的技术方案,具体包括:识别目标图像中的文本框,并根据文本框中包含关键词的目标文本框拟合用于对目标图像进行区域划分的直线;根据直线将目标图像划分为多个图像区域;对多个图像区域中各图像区域的文本框进行字段识别和字段信息识别,得到各图像区域中相对应的字段和字段信息;根据各图像区域中相对应的字段和字段信息生成与目标图像对应的结构化信息。实施本公开的实施例,一方面,可以通过对图像的区域划分实现对于结构化信息的自动提取,提升结构化信息的提取效率。另一方面,可以基于包含关键词的目标文本框拟合出个性化匹配目标图像的直线,从而可以基于直线划分出的区域精准提取出各区域的结构化信息,提升结构化信息的提取精度。
[0021]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
[0022]附图用于更好地理解本专利技术,不构成对本专利技术的不当限定。其中:
[0023]图1示意性示出了可以应用本公开实施例的一种针对图像的信息提取方法及针对图像的信息提取装置的示例性系统架构的示意图;
[0024]图2示意性示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图;
[0025]图3示意性示出了根据本公开的一个实施例的针对图像的信息提取方法的流程图;
[0026]图4示意性示出了根据本公开的一个实施例的直线划分后得到的目标图像示意图;
[0027]图5示意性示出了根据本公开的一个实施例的目标图像中直线距离特征的示意图;
[0028]图6示意性示出了根据本公开的一个实施例的目标图像中定向投影示意图;
[0029]图7示意性示出了根据本公开的一个实施例的目标图像中包含“不对应的字段与字段信息展示距离较近”情况的示意图;
[0030]图8示意性示出了根据本公开的一个实施例的目标图像中包含“数量/单位”情况的示意图;
[0031]图9示意性示出了根据本公开的一个实施例的目标图像中包含“多行打印”情况的示意图;
[0032]图10示意性示出了根据本公开的一个实施例的目标图像中包含“多行打印”情况的处理流程示意图;
[0033]图11示意性示出了根据本公开的一个实施例的结构化信息示意图;
[0034]图12示意性示出了根据本公开的一个实施例的应用图像区域规划模型的多端交互示意图;
[0035]图13示意性示出了根据本公开的一个实施例的针对图像的信息提取方法的流程图;
[0036]图14示意性示出了根据本公开的一个实施例中的针对图像的信息提取装置的结构框图。
具体实施方式
[0037]图1示出了可以应用本公开实施例的一种针对图像的信息提取方法及针对图像的信息提取装置的示例性应用环境的系统架构的示意图。
[0038]如图1所示,系统架构100可以包括终端设备101、102、103中的一个或多个,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。终端设备101、102、103可以是具有显示屏的各种电子设备,包括但不限于台式计算机、便携式计算机、智能手机和平板电脑等等。应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。其中,服务器105用于执行:识别目标图像中的文本框,并根据文本框中包含关键词的目标文本框拟合用于对目标图像进行区域划分的直线;根据直线将目标图像划分为多个图像区域;对多个图像区域中各图像区域的文本框进行字段识别和字段信息识别,得到各本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种针对图像的信息提取方法,其特征在于,包括:识别目标图像中的文本框,并根据所述文本框中包含关键词的目标文本框拟合用于对所述目标图像进行区域划分的直线;根据所述直线将所述目标图像划分为多个图像区域;对所述多个图像区域中各图像区域的文本框进行字段识别和字段信息识别,得到所述各图像区域中相对应的字段和字段信息;根据所述各图像区域中相对应的字段和字段信息生成与所述目标图像对应的结构化信息。2.根据权利要求1所述的方法,其特征在于,根据所述文本框中包含关键词的目标文本框拟合用于对所述目标图像进行区域划分的直线,包括:从所述文本框中确定命中预设词库中关键词的至少一类目标文本框;其中,每一类目标文本框中的目标文本框数量为至少一个;确定所述至少一类目标文本框中每个目标文本框的位置信息;根据所述位置信息确定所述每一类目标文本框对应的直线;其中,所述每一类目标文本框对应的直线均用于对所述目标图像进行区域划分。3.根据权利要求2所述的方法,其特征在于,根据所述位置信息确定所述每一类目标文本框对应的直线,包括:根据所述位置信息确定类内目标文本框的中心点,并根据类内目标文本框的中心点确定所述每一类目标文本框对应的直线;其中,所述每一类目标文本框对应的直线用于连接类内目标文本框的中心点;或者,根据所述位置信息确定类内目标文本框的边界斜率,并根据类内目标文本框的边界斜率确定所述每一类目标文本框对应的直线;其中,所述每一类目标文本框对应的直线用于贯穿类内目标文本框,所述边界斜率包括上边界斜率和下边界斜率中至少一种。4.根据权利要求1所述的方法,其特征在于,所述多个图像区域包括明细区域、头部区域和尾部区域,所述明细区域中的字段与字段信息之间为一对一关系或一对多关系,所述头部区域中的字段和字段信息之间为一对一关系,所述尾部区域中的字段和字段信息之间为一对一关系。5.根据权利要求1所述的方法,其特征在于,对所述多个图像区域中各图像区域的文本框进行字段识别和字段信息识别,包括:通过预训练的分类器计算目标图像区域中的文本框相对于所述目标图像中边框的直线距离特征;其中,所述目标图像区域为所述多个图像区域中任一图像区域;通过所述分类器计算所述目标图像区域中各文本框相对于所述目标图像区域中各字段的水平距离特征;通过所述分类器对所述目标图像区域中各文本框进行特定对象识别,得到对象识别结果;其中,所述特定对象包括符号、数字、字中至少一种;通过所述分类器对所述目标图像区域中各文本框进行定向投影,得到...

【专利技术属性】
技术研发人员:刘昊岳王亚领马文伟刘设伟
申请(专利权)人:泰康在线财产保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1