表格类文本查询方法及装置制造方法及图纸

技术编号:36082766 阅读:31 留言:0更新日期:2022-12-24 10:57
本公开提供一种表格类文本查询方法及装置。所述方法包括:检测待处理图像中的表格中的文本框位置;根据文本框位置,确定表格中的多个字段的查询范围;根据查询范围,对各个字段的信息进行查询,获得查询结果。根据本公开,能够对于每个字段,确定其查询范围,并在查询范围内识别文本内容,确定查询结果,在查询范围内,噪声信息较少,内容均为同一类别的文本内容,训练能够检测同类文本内容的检测模型的难度较低,因此,可提升查询结果的准确性。可提升查询结果的准确性。可提升查询结果的准确性。

【技术实现步骤摘要】
表格类文本查询方法及装置


[0001]本公开涉及计算机
,尤其涉及一种表格类文本查询方法及装置。

技术介绍

[0002]光学字符识别(Optical Character Recognition,OCR)技术已广泛应用于将图像中代表文字的像素点转换为可编辑的文字,更进一步,在特定的场景中,通过对文字在图片上位置关系的解析,还可将图片中的文字以特殊的形式组合起来,比如办公场景(印刷体识别、手写文字识别、表格识别),交通场景(驾驶证识别、车牌识别、车辆合格证识别),卡证场景(身份证识别、银行卡识别、户口本识别、营业执照识别)等等。
[0003]在销售场景中,供货方会提供关于商品详细信息的供货单,如商品名称、数量、单价等等,这样的货物单据往往以手写表格的形式呈现,经过实践发现目前手写表格的识别技术存在一些弊端:对于表格单元格的识别不够准确,如多单元格被识别为单元格,且单元格的识别易受到图片阴影、折痕的影响;对表格中文字的识别不够准确,目前大部分表格识别的功能是基于印刷体表格图片进行训练的,故而对表格中的手写字体的识别准确率不能达到生产要求本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种表格类文本查询方法,其特征在于,包括:检测待处理图像中的表格中的文本框位置,其中,所述待处理图像为包括表格的图像,所述表格中包括文本内容,所述文本框为包围所述表格的单元格中的文本内容的矩形框;根据所述文本框位置,确定所述表格中的多个字段的查询范围;根据所述查询范围,对所述各个字段的信息进行查询,获得查询结果。2.根据权利要求1所述的方法,其特征在于,根据所述文本框位置,确定所述表格中的多个字段的查询范围,包括:根据所述表格的位置,确定所述多个字段的关键字,所述关键字为所述文本内容;根据所述关键字的文本框的位置,以及所述表格的结束位置,确定所述查询范围。3.根据权利要求2所述的方法,其特征在于,根据所述关键字的文本框的位置,以及所述表格的结束位置,确定所述查询范围,包括:根据所述关键字的文本框下边界,以及所述表格的结束位置的下边界,确定所述查询范围。4.根据权利要求2所述的方法,其特征在于,所述结束位置包括所述表格的各列的最后一个单元格,根据所述关键字的文本框的位置,以及所述表格的结束位置,确定所述查询范围,包括:确定与所述关键字的文本框处于同一列的最后一个单元格中文本内容的语义信息;在所述语义信息为预设信息的情况下,根据所述关键字的文本框的位置,以及所述最后一个单元格中文本内容的文本框的位置,确定所述查询范围。5.根据权利要求4所述的方法,其特征在于,在所述语义信息为预设信息的情况下,根据所述关键字的文本框的位置,以及所述最后一个单元格中...

【专利技术属性】
技术研发人员:闫恺杜向阳
申请(专利权)人:深圳擎盾信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1