表格字符识别方法、装置、介质和电子设备制造方法及图纸

技术编号:37880387 阅读:18 留言:0更新日期:2023-06-15 21:08
本申请涉及一种表格字符识别方法,通过对原始表格图像进行表格框线识别;按照所识别的表格框线坐标对所述原始表格图像进行切割,提取出第一单元格图像;对所述第一单元格图像进行缩放,得到第二单元格图像;将所述第二单元格图像放回原位,得到新表格图像。能够对原始表格图像进行表格框线识别,然后将每个表格单元格所在的区域(子图)按一定缩放系数做局部缩小,生成当前页的新图像,文本间的间距显著变宽。然后在新图像的基础上进行OCR识别,得到新图像的识别结果,以此良好地防止了OCR字符识别的粘连现象,使得所识别得到的文本信息更为精确,用户阅读不会发生字符粘连而导致文本信息错乱的发生,提高用户阅读性。提高用户阅读性。提高用户阅读性。

【技术实现步骤摘要】
表格字符识别方法、装置、介质和电子设备


[0001]本公开涉及文档处理
,尤其涉及一种表格字符识别方法、装置、计算机储存介质和电子设备。

技术介绍

[0002]智能文档理解场景中,文档的种类有很多,例如:订单、长文档、email等,其中大量文档含有表格内容。用户若是要很好地理解文档内容,则需要准确理解表格结构和表格内的文字内容。
[0003]文字识别需要用到OCR(Optical Character Recognition,光学字符识别)技术,而当跨单元格文字距离很紧凑时,OCR算法经常将两个字符串识别为一个字符串,出现表格字符识别的粘连问题。当出现这种表格字符识别的粘连问题时,会导致后续信息提取等任务失败,这就使得在文字识别结束,所得到的文本信息以及文本内容,存在两个单元格的字靠很近、字符粘连不易阅读的问题,导致用户不易阅读、难以理解文本信息,因此对文本阅读的体验感很差。
[0004]因此,面对文字识别所存在上述问题,需要采取更优化的方法避免识别中出现字符粘连。

技术实现思路

[0005]为了解决上述问题,本申请提出一种表格字符识别方法、装置、计算机储存介质和电子设备。
[0006]本申请一方面,提出一种表格字符识别方法,包括如下步骤:
[0007]对原始表格图像进行表格框线识别;
[0008]按照所识别的表格框线坐标对所述原始表格图像进行切割,提取出第一单元格图像;
[0009]对所述第一单元格图像进行缩放,得到第二单元格图像;
[0010]将所述第二单元格图像放回原位,得到新表格图像。
[0011]作为本申请的一种可选实施方案,可选地,所述对原始表格图像进行表格框线识别,包括:
[0012]识别所述原始表格图像的表格区域;
[0013]根据所述表格区域,识别所述表格区域的横线和纵线;
[0014]根据所述横线和纵线的交叉点,确定所述表格区域的单元格;
[0015]根据所述表格区域的单元格,确定所述表格框线坐标。
[0016]作为本申请的一种可选实施方案,可选地,所述对所述第一单元格图像进行缩放,得到第二单元格图像,包括:
[0017]预设缩放比例k;
[0018]将所述缩放比例k与所述第一单元格图像的尺寸相乘,按照相乘后的尺寸缩小或
放大所述第一单元格图像,得到所述第二单元格图像。
[0019]作为本申请的一种可选实施方案,可选地,所述将所述第二单元格图像放回原位,得到新图像表格,包括:
[0020]分别计算所述第一单元格图像和所述第二单元格图像的中心;
[0021]将所述第二单元格图像放回至所述原始表格图像,并使所述第二单元格图像和所述第一单元格图像的中心重合;
[0022]删除所述第一单元格图像,获得所述新图像。
[0023]作为本申请的一种可选实施方案,可选地,所述将所述第二单元格图像放回至所述原始表格图像,包括:
[0024]根据所述表格框线坐标,确定所述第一单元格图像的原位置;
[0025]将所述第二单元格图像放回至所述第一单元格图像的原位置。
[0026]作为本申请的一种可选实施方案,可选地,在将所述第二单元格图像放回原位,得到新表格图像之后,还包括:
[0027]对所述新表格图像进行OCR识别,获得OCR识别结果;其中,所述OCR识别结果包括所述新表格图像中各文本的文本内容和文本位置;
[0028]根据所述表格区域和缩放比例k,对所述OCR识别结果进行调整,获得所述原始表格图片的识别结果。
[0029]作为本申请的一种可选实施方案,可选地,所述文本位置包括包围所述文本的第一矩形框的坐标;
[0030]所述根据所述表格区域和缩放比例k,对所述OCR识别结果进行调整,获得所述原始表格图片的识别结果,包括:
[0031]判断所述第一矩形框的坐标是否在所述表格框线坐标的范围内;
[0032]若是,则将所述缩放比例的倒数1/k与所述第一矩形框的尺寸相乘,按照相乘后的尺寸放大或缩小所述第一矩形框,得到第二矩形框;
[0033]计算当所述第一矩形框和第二矩形框的中心重合时,所述第二矩形框的坐标;
[0034]将所述文本内容和第二矩形框的坐标作为所述原始表格图片的识别结果。
[0035]本申请另一方面,提供一种表格字符识别装置,包括:
[0036]表格框线识别模块,用于对原始表格图像进行表格框线识别;
[0037]表格单元切割模块,用于按照所识别的表格框线坐标对所述原始表格图像进行切割,提取出第一单元格图像;
[0038]图像缩放模块,用于对所述第一单元格图像进行缩放,得到第二单元格图像;
[0039]图像复位模块,用于将所述第二单元格图像放回原位,得到新表格图像。
[0040]作为本申请的一种可选实施方案,可选地,
[0041]所述表格框线识别模块,包括:第一识别模块,用于识别所述原始表格图像的表格区域;第二识别模块,用于根据所述表格区域,识别所述表格区域的横线和纵线;单元格确定模块,用于根据所述横线和纵线的交叉点,确定所述表格区域的单元格;坐标确定模块,用于根据所述表格区域的单元格,确定所述表格框线坐标;
[0042]所述图像缩放模块,包括:配置模块,用于预设缩放比例k;缩放模块,用于将所述缩放比例k与所述第一单元格图像的尺寸相乘,按照相乘后的尺寸缩小或放大所述第一单
元格图像,得到所述第二单元格图像;
[0043]所述图像复位模块,包括:计算模块,用于分别计算所述第一单元格图像和所述第二单元格图像的中心;复位模块,用于将所述第二单元格图像放回至所述原始表格图像,并使所述第二单元格图像和所述第一单元格图像的中心重合;新图像获取模块,用于删除所述第一单元格图像,获得所述新图像;
[0044]其中,复位模块,包括:第一复位模块,用于根据所述表格框线坐标,确定所述第一单元格图像的原位置;第二复位模块,用于将所述第二单元格图像放回至所述第一单元格图像的原位置;
[0045]所述图像复位模块,还包括:
[0046]OCR识别模块,用于对所述新表格图像进行OCR识别,获得OCR识别结果;其中,所述OCR识别结果包括所述新表格图像中各文本的文本内容和文本位置;所述文本位置包括包围所述文本的第一矩形框的坐标;
[0047]文本调整模块,用于根据所述表格区域和缩放比例k,对所述OCR识别结果进行调整,获得所述原始表格图片的识别结果,包括:
[0048]判断所述第一矩形框的坐标是否在所述表格框线坐标的范围内;
[0049]若是,则将所述缩放比例的倒数1/k与所述第一矩形框的尺寸相乘,按照相乘后的尺寸放大或缩小所述第一矩形框,得到第二矩形框;
[0050]计算当所述第一矩形框和第二矩形框的中心重合时,所述第二矩形框的坐标;
[0051]将所述文本内本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种表格字符识别方法,其特征在于,包括如下步骤:对原始表格图像进行表格框线识别;按照所识别的表格框线坐标对所述原始表格图像进行切割,提取出第一单元格图像;对所述第一单元格图像进行缩放,得到第二单元格图像;将所述第二单元格图像放回原位,得到新表格图像。2.根据权利要求1所述的表格字符识别方法,其特征在于,所述对原始表格图像进行表格框线识别,包括:识别所述原始表格图像的表格区域;根据所述表格区域,识别所述表格区域的横线和纵线;根据所述横线和纵线的交叉点,确定所述表格区域的单元格;根据所述表格区域的单元格,确定所述表格框线坐标。3.根据权利要求2所述的表格字符识别方法,其特征在于,所述对所述第一单元格图像进行缩放,得到第二单元格图像,包括:预设缩放比例k;将所述缩放比例k与所述第一单元格图像的尺寸相乘,按照相乘后的尺寸缩小或放大所述第一单元格图像,得到所述第二单元格图像。4.根据权利要求3所述的表格字符识别方法,其特征在于,所述将所述第二单元格图像放回原位,得到新图像表格,包括:分别计算所述第一单元格图像和所述第二单元格图像的中心;将所述第二单元格图像放回至所述原始表格图像,并使所述第二单元格图像和所述第一单元格图像的中心重合;删除所述第一单元格图像,获得所述新图像。5.根据权利要求4所述的表格字符识别方法,其特征在于,所述将所述第二单元格图像放回至所述原始表格图像,包括:根据所述表格框线坐标,确定所述第一单元格图像的原位置;将所述第二单元格图像放回至所述第一单元格图像的原位置。6.根据权利要求3所述的表格字符识别方法,其特征在于,在将所述第二单元格图像放回原位,得到新表格图像之后,还包括:对所述新表格图像进行O...

【专利技术属性】
技术研发人员:王健贾岿袁野
申请(专利权)人:上海弘玑信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1