表格类文本查询方法及装置制造方法及图纸

技术编号:36082766 阅读:15 留言:0更新日期:2022-12-24 10:57
本公开提供一种表格类文本查询方法及装置。所述方法包括:检测待处理图像中的表格中的文本框位置;根据文本框位置,确定表格中的多个字段的查询范围;根据查询范围,对各个字段的信息进行查询,获得查询结果。根据本公开,能够对于每个字段,确定其查询范围,并在查询范围内识别文本内容,确定查询结果,在查询范围内,噪声信息较少,内容均为同一类别的文本内容,训练能够检测同类文本内容的检测模型的难度较低,因此,可提升查询结果的准确性。可提升查询结果的准确性。可提升查询结果的准确性。

【技术实现步骤摘要】
表格类文本查询方法及装置


[0001]本公开涉及计算机
,尤其涉及一种表格类文本查询方法及装置。

技术介绍

[0002]光学字符识别(Optical Character Recognition,OCR)技术已广泛应用于将图像中代表文字的像素点转换为可编辑的文字,更进一步,在特定的场景中,通过对文字在图片上位置关系的解析,还可将图片中的文字以特殊的形式组合起来,比如办公场景(印刷体识别、手写文字识别、表格识别),交通场景(驾驶证识别、车牌识别、车辆合格证识别),卡证场景(身份证识别、银行卡识别、户口本识别、营业执照识别)等等。
[0003]在销售场景中,供货方会提供关于商品详细信息的供货单,如商品名称、数量、单价等等,这样的货物单据往往以手写表格的形式呈现,经过实践发现目前手写表格的识别技术存在一些弊端:对于表格单元格的识别不够准确,如多单元格被识别为单元格,且单元格的识别易受到图片阴影、折痕的影响;对表格中文字的识别不够准确,目前大部分表格识别的功能是基于印刷体表格图片进行训练的,故而对表格中的手写字体的识别准确率不能达到生产要求。
[0004]公开于本申请
技术介绍
部分的信息仅仅旨在加深对本申请的一般
技术介绍
的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。

技术实现思路

[0005]本公开实施例提供一种表格类文本查询方法及装置。能够对于每个字段,确定其查询范围,并在查询范围内识别文本内容,确定查询结果,在查询范围内,噪声信息较少,内容均为同一类别的文本内容,训练能够检测同类文本内容的检测模型的难度较低,因此,可提升查询结果的准确性。
[0006]本公开实施例的第一方面,提供一种表格类文本查询方法,包括:
[0007]检测待处理图像中的表格中的文本框位置,其中,所述待处理图像为包括表格的图像,所述表格中包括文本内容,所述文本框为包围所述表格的单元格中的文本内容的矩形框;
[0008]根据所述文本框位置,确定所述表格中的多个字段的查询范围;
[0009]根据所述查询范围,对所述各个字段的信息进行查询,获得查询结果。
[0010]根据本公开的实施例,根据所述文本框位置,确定所述表格中的多个字段的查询范围,包括:
[0011]根据所述表格的位置,确定所述多个字段的关键字,所述关键字为所述文本内容;
[0012]根据所述关键字的文本框的位置,以及所述表格的结束位置,确定所述查询范围。
[0013]根据本公开的实施例,根据所述关键字的文本框的位置,以及所述表格的结束位置,确定所述查询范围,包括:
[0014]根据所述关键字的文本框下边界,以及所述表格的结束位置的下边界,确定所述查询范围。
[0015]根据本公开的实施例,所述结束位置包括所述表格的各列的最后一个单元格,
[0016]根据所述关键字的文本框的位置,以及所述表格的结束位置,确定所述查询范围,包括:
[0017]确定与所述关键字的文本框处于同一列的最后一个单元格中文本内容的语义信息;
[0018]在所述语义信息为预设信息的情况下,根据所述关键字的文本框的位置,以及所述最后一个单元格中文本内容的文本框的位置,确定所述查询范围。
[0019]根据本公开的实施例,在所述语义信息为预设信息的情况下,根据所述关键字的文本框的位置,以及所述最后一个单元格中文本内容的文本框的位置,确定所述查询范围,包括:
[0020]确定所述关键字的文本框下边界;
[0021]确定所述最后一个单元格中文本内容的文本框的上边界;
[0022]根据所述下边界和所述上边界,确定所述查询范围。
[0023]根据本公开的实施例,根据所述关键字的文本框的位置,以及所述表格的结束位置,确定所述查询范围,包括:
[0024]确定以所述关键字的文本框的下边界为起始位置的预设尺寸的扩展范围;
[0025]将所述扩展范围确定为所述查询范围。
[0026]根据本公开的实施例,根据所述查询范围,对所述各个字段的信息进行查询,获得查询结果,包括:
[0027]确定所述查询范围中文本内容的语义信息,获得所述查询结果。
[0028]本公开实施例的第二方面,提供一种表格类文本查询装置,包括:
[0029]位置模块,用于检测待处理图像中的表格中的文本框位置,其中,所述待处理图像为包括表格的图像,所述表格中包括文本内容,所述文本框为包围所述表格的单元格中的文本内容的矩形框;
[0030]范围模块,用于根据所述文本框位置,确定所述表格中的多个字段的查询范围;
[0031]查询模块,用于根据所述查询范围,对所述各个字段的信息进行查询,获得查询结果。
[0032]根据本公开的实施例,所述范围模块进一步用于:根据所述表格的位置,确定所述多个字段的关键字,所述关键字为所述文本内容;根据所述关键字的文本框的位置,以及所述表格的结束位置,确定所述查询范围。
[0033]根据本公开的实施例,所述范围模块进一步用于:根据所述关键字的文本框下边界,以及所述表格的结束位置的下边界,确定所述查询范围。
[0034]根据本公开的实施例,所述结束位置包括所述表格的各列的最后一个单元格,所述范围模块进一步用于:确定与所述关键字的文本框处于同一列的最后一个单元格中文本内容的语义信息;在所述语义信息为预设信息的情况下,根据所述关键字的文本框的位置,以及所述最后一个单元格中文本内容的文本框的位置,确定所述查询范围。
[0035]根据本公开的实施例,所述范围模块进一步用于:确定所述关键字的文本框下边
界;确定所述最后一个单元格中文本内容的文本框的上边界;根据所述下边界和所述上边界,确定所述查询范围。
[0036]根据本公开的实施例,所述范围模块进一步用于:确定以所述关键字的文本框的下边界为起始位置的预设尺寸的扩展范围;将所述扩展范围确定为所述查询范围。
[0037]根据本公开的实施例,所述查询模块进一步用于:确定所述查询范围中文本内容的语义信息,获得所述查询结果。
[0038]本公开实施例的第三方面,提供一种表格类文本查询设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为调用所述存储器存储的指令,以执行上述方法。
[0039]本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现上述方法。
附图说明
[0040]图1示例性地示出本公开实施例的表格类文本查询方法的流程示意图;
[0041]图2示例性地示出本公开实施例的表格类文本查询方法的案例示意图;
[0042]图3示例性地示出本公开实施例的表格类文本查询装置的框图;
[0043]图4是根据一示例性实施例示出的一种表格类文本查询设备的框图。
具体实施方式...

【技术保护点】

【技术特征摘要】
1.一种表格类文本查询方法,其特征在于,包括:检测待处理图像中的表格中的文本框位置,其中,所述待处理图像为包括表格的图像,所述表格中包括文本内容,所述文本框为包围所述表格的单元格中的文本内容的矩形框;根据所述文本框位置,确定所述表格中的多个字段的查询范围;根据所述查询范围,对所述各个字段的信息进行查询,获得查询结果。2.根据权利要求1所述的方法,其特征在于,根据所述文本框位置,确定所述表格中的多个字段的查询范围,包括:根据所述表格的位置,确定所述多个字段的关键字,所述关键字为所述文本内容;根据所述关键字的文本框的位置,以及所述表格的结束位置,确定所述查询范围。3.根据权利要求2所述的方法,其特征在于,根据所述关键字的文本框的位置,以及所述表格的结束位置,确定所述查询范围,包括:根据所述关键字的文本框下边界,以及所述表格的结束位置的下边界,确定所述查询范围。4.根据权利要求2所述的方法,其特征在于,所述结束位置包括所述表格的各列的最后一个单元格,根据所述关键字的文本框的位置,以及所述表格的结束位置,确定所述查询范围,包括:确定与所述关键字的文本框处于同一列的最后一个单元格中文本内容的语义信息;在所述语义信息为预设信息的情况下,根据所述关键字的文本框的位置,以及所述最后一个单元格中文本内容的文本框的位置,确定所述查询范围。5.根据权利要求4所述的方法,其特征在于,在所述语义信息为预设信息的情况下,根据所述关键字的文本框的位置,以及所述最后一个单元格中...

【专利技术属性】
技术研发人员:闫恺杜向阳
申请(专利权)人:深圳擎盾信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1