表格类内容识别方法及装置制造方法及图纸

技术编号:36083613 阅读:10 留言:0更新日期:2022-12-24 10:58
本公开提供一种表格类内容识别方法及装置。所述方法包括:检测待处理图像中的表格中的文本框位置;根据文本框位置,确定表格中的多个关键字的查询范围;根据查询范围,对关键字的字段进行查询,获得字段查询结果;根据图像尺寸,对字段的内容信息进行查询,获得内容查询结果;根据关键字、字段查询结果和内容查询结果,获得表格的查询结果。根据本公开,能够分别确定与关键字同列的字段,与字段同行的内容,以及与关键字同行的其他关键字,从而对各个字段的内容及标题进行查询,获得更准确的查询结果,减少了由于填写字迹歪斜,导致查询错误的可能性,提升了查询准确率。提升了查询准确率。提升了查询准确率。

【技术实现步骤摘要】
表格类内容识别方法及装置


[0001]本公开涉及计算机
,尤其涉及一种表格类内容识别方法及装置。

技术介绍

[0002]光学字符识别(Optical Character Recognition,OCR)技术已广泛应用于将图像中代表文字的像素点转换为可编辑的文字,更进一步,在特定的场景中,通过对文字在图片上位置关系的解析,还可将图片中的文字以特殊的形式组合起来,比如办公场景(印刷体识别、手写文字识别、表格识别),交通场景(驾驶证识别、车牌识别、车辆合格证识别),卡证场景(身份证识别、银行卡识别、户口本识别、营业执照识别)等等。
[0003]在销售场景中,供货方会提供关于商品详细信息的供货单,如商品名称、数量、单价等等,这样的货物单据往往以手写表格的形式呈现,经过实践发现目前手写表格的识别技术存在一些弊端:对于表格单元格的识别不够准确,如多单元格被识别为单元格,且单元格的识别易受到图片阴影、折痕的影响;对表格中文字的识别不够准确,目前大部分表格识别的功能是基于印刷体表格图片进行训练的,故而对表格中的手写字体的识别准确率不能达到生产要求。
[0004]公开于本申请
技术介绍
部分的信息仅仅旨在加深对本申请的一般
技术介绍
的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。

技术实现思路

[0005]本公开实施例提供一种表格类内容识别方法及装置。能够分别确定与关键字同列的字段,与字段同行的内容,以及与关键字同行的其他关键字,从而对各个字段的内容及标题进行查询,获得更准确的查询结果,减少了由于填写字迹歪斜,导致查询错误的可能性,提升了查询准确率。
[0006]本公开实施例的第一方面,提供一种表格类内容识别方法,包括:
[0007]检测待处理图像中的表格中的文本框位置,其中,所述待处理图像为包括表格的图像,所述表格中包括文本内容,所述文本框为包围所述表格的单元格中的文本内容的矩形框;
[0008]根据所述文本框位置,确定所述表格中的多个关键字的查询范围,所述查询范围中包括所述关键字的多个字段;
[0009]根据所述查询范围,对所述关键字的字段进行查询,获得字段查询结果;
[0010]根据所述图像尺寸,对所述字段的内容信息进行查询,获得内容查询结果;
[0011]根据所述关键字、字段查询结果和所述内容查询结果,获得所述表格的查询结果。
[0012]根据本公开的实施例,根据所述查询范围,对所述关键字的字段进行查询,获得字段查询结果,包括:
[0013]对于任一关键字的查询范围,确定所述关键字的各个字段的文本框与所述查询范
围的重叠区域,与所述文本框之间的第一面积比例;
[0014]在所述各个字段的文本框中,确定所述第一面积比例大于或等于第一阈值的目标文本框;
[0015]将所述目标文本框中的字段确定为字段查询结果。
[0016]根据本公开的实施例,根据所述图像尺寸,对所述字段的内容信息进行查询,获得内容查询结果,包括:
[0017]根据所述图像尺寸,获取图像宽度;
[0018]获取所述字段的文本框的尺寸信息;
[0019]根据所述字段的文本框的尺寸信息,和所述图像宽度,获得查询框;
[0020]根据与所述字段相同行的各个单元格中文本内容的文本框,与所述查询框之间的关系,确定所述内容查询结果。
[0021]根据本公开的实施例,根据所述字段的文本框的尺寸信息,和所述图像宽度,获得查询框,包括:
[0022]根据所述字段的文本框的尺寸信息,获得查询框的高度;
[0023]根据所述图像宽度,获得查询框的宽度;
[0024]根据所述查询框的高度和宽度,获得在高度方向与所述字段的文本框重合的查询框。
[0025]根据本公开的实施例,根据与所述字段相同行的各个单元格中文本内容的文本框,与所述查询框之间的关系,确定所述内容查询结果,包括:
[0026]确定与所述字段相同行的各个单元格中文本内容的文本框,与所述查询框的重叠区域,与各个单元格中文本内容的文本框之间的第二面积比;
[0027]确定所述第二面积比大于或等于第二阈值的目标内容文本框;
[0028]将所述目标内容文本框中的文本内容确定为所述内容查询结果。
[0029]根据本公开的实施例,根据所述关键字、字段查询结果和所述内容查询结果,获得所述表格的查询结果,包括:
[0030]确定与所述关键字的文本框高度相同,宽度等于图像宽度的第二查询框;
[0031]确定与所述关键字同行的各个单元格中文本内容的文本框与所述第二查询框之间的重叠区域,与各所述关键字同行的各个单元格中文本内容的文本框之间的第三面积比;
[0032]确定所述第三面积比大于或等于第三阈值的目标关键字文本框;
[0033]将所述目标关键字文本框中的文本内容,确定为所述查询结果。
[0034]根据本公开的实施例,所述方法还包括:
[0035]将所述查询结果中的预设符号确定为错误信息;
[0036]删除存在错误信息的文本框中的文本内容;
[0037]根据所述错误信息,生成提示信息。
[0038]本公开实施例的第二方面,提供一种表格类内容识别装置,包括:
[0039]位置模块,用于检测待处理图像中的表格中的文本框位置,其中,所述待处理图像为包括表格的图像,所述表格中包括文本内容,所述文本框为包围所述表格的单元格中的文本内容的矩形框;
[0040]范围模块,用于根据所述文本框位置,确定所述表格中的多个关键字的查询范围,所述查询范围中包括所述关键字的多个字段;
[0041]字段模块,用于根据所述查询范围,对所述关键字的字段进行查询,获得字段查询结果;
[0042]内容模块,用于根据所述图像尺寸,对所述字段的内容信息进行查询,获得内容查询结果;
[0043]结果模块,用于根据所述关键字、字段查询结果和所述内容查询结果,获得所述表格的查询结果。
[0044]根据本公开的实施例,所述字段模块进一步用于:
[0045]对于任一关键字的查询范围,确定所述关键字的各个字段的文本框与所述查询范围的重叠区域,与所述文本框之间的第一面积比例;
[0046]在所述各个字段的文本框中,确定所述第一面积比例大于或等于第一阈值的目标文本框;
[0047]将所述目标文本框中的字段确定为字段查询结果。
[0048]根据本公开的实施例,所述内容模块进一步用于:
[0049]根据所述图像尺寸,获取图像宽度;
[0050]获取所述字段的文本框的尺寸信息;
[0051]根据所述字段的文本框的尺寸信息,和所述图像宽度,获得查询框;
[0052]根据与所述字段相同行的各个单元格中文本内容的文本框,与所述查询框之间的关系,确定所述内容查询结果。
[0053]根据本公开本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种表格类文本内容识别方法,其特征在于,包括:检测待处理图像中的表格中的文本框位置,其中,所述待处理图像为包括表格的图像,所述表格中包括文本内容,所述文本框为包围所述表格的单元格中的文本内容的矩形框;根据所述文本框位置,确定所述表格中的多个关键字的查询范围,所述查询范围中包括所述关键字的多个字段;根据所述查询范围,对所述关键字的字段进行查询,获得字段查询结果;根据所述图像尺寸,对所述字段的内容信息进行查询,获得内容查询结果;根据所述关键字、字段查询结果和所述内容查询结果,获得所述表格的查询结果。2.根据权利要求1所述的方法,其特征在于,根据所述查询范围,对所述关键字的字段进行查询,获得字段查询结果,包括:对于任一关键字的查询范围,确定所述关键字的各个字段的文本框与所述查询范围的重叠区域,与所述文本框之间的第一面积比例;在所述各个字段的文本框中,确定所述第一面积比例大于或等于第一阈值的目标文本框;将所述目标文本框中的字段确定为字段查询结果。3.根据权利要求1所述的方法,其特征在于,根据所述图像尺寸,对所述字段的内容信息进行查询,获得内容查询结果,包括:根据所述图像尺寸,获取图像宽度;获取所述字段的文本框的尺寸信息;根据所述字段的文本框的尺寸信息,和所述图像宽度,获得查询框;根据与所述字段相同行的各个单元格中文本内容的文本框,与所述查询框之间的关系,确定所述内容查询结果。4.根据权利要求3所述的方法,其特征在于,根据所述字段的文本框的尺寸信息,和所述图像宽度,获得查询框,包括:根据所述字段的文本框的尺寸信息,获得查询框的高度;根据所述图像宽度,获得查询框的宽度;根据所述查询框的高度和宽度,获得在高度方向与所述字段的文本框重合的查询框。5.根据权利要求3所述的方法,其特征在于,根据与所述字段相同行的各个单元格中文本内容的文本框,与所述查询框之间的关系,确定所述内容查询结果,包括:确定与所述字段相同行的各个单元格中文本内容的文本框,与所述查询框的重叠区域,与各...

【专利技术属性】
技术研发人员:闫恺杜向阳
申请(专利权)人:深圳擎盾信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1