用于识别图像中的表格内的字符的方法和装置制造方法及图纸

技术编号:21892737 阅读:16 留言:0更新日期:2019-08-17 14:50
根据本公开内容的示例性实现方式,提供了一种用于识别图像中的表格内的字符的方法和装置。具体地,提供了一种用于识别图像中的表格内的字符的方法,包括:识别图像中的一组内容点,该内容点表示与表格的边或字符相关联的像素点;基于一组内容点与图像中的一组预定义直线之间的位置关系,确定表格的边相对于图像的边线的斜率;基于斜率来将表格调整为与边线平行;以及获取经调整的表格内的字符。根据本公开内容的示例性实现方式,还提供了用于识别图像中的表格内的字符的相应的装置、设备和计算机存储介质。

Method and device for recognizing characters in tables in images

【技术实现步骤摘要】
用于识别图像中的表格内的字符的方法和装置
本公开的实施方式涉及图像识别领域,具体涉及用于识别图像中的表格内的字符的方法、装置、设备和计算机可读存储介质。
技术介绍
随着计算机技术的发展,图像识别技术得到了快速发展,而且用于识别各类图像的图像识别技术也越来越多。现在图像识别技术已经越来越广泛地被应用,诸如人脸识别等。随着识别技术的提高,越来越多的行业也开始使用图像识别技术。图像识别技术也开始用于辅助办公自动化。以企业财务领域为例,目前存在大量纸质表格,而财务部门需要将这些表格数据录入电脑进行处理。然而,人工进行数据的录入成本是比较高的,因此通过将这些票据扫描成图像,然后通过使用光学字符识别(OCR,OpticalCharacterRecognition)方法,自动将票据上的字段识别出来。OCR可以很大程序上提高处理的效率。然而由于图表放置问题,会导致存存无法识别图像中表格中的字符的问题。
技术实现思路
根据本公开内容的示例实施方式,提供了一种用于识别图像中的表格内的字符的方案在本公开内容的第一方面中,提供了一种用于识别图像中的表格内的字符的方法。具体地,该方法包括:识别图像中的一组内容点,该内容点表示与表格的边或字符相关联的像素点;基于一组内容点与图像中的一组预定义直线之间的位置关系,确定表格的边相对于图像的边线的斜率;基于斜率来将表格调整为与边线平行;以及获取经调整的表格内的字符。在本公开内容的第二方面中,提供了一种用于识别图像中的表格内的字符的装置。具体地,该装置包括:识别模块,识别模块被配置为识别图像中的一组内容点,该内容点表示与表格的边或字符相关联的像素点;斜率确定模块,确定模块被配置为基于一组内容点与图像中的一组预定义直线之间的位置关系,确定表格的边相对于图像的边线的斜率;调整模块,调整模块被配置为基于斜率来将表格调整为与边线平行;以及获取模块,获取模块被配置为获取经调整的表格内的字符。在本公开内容的第三方面中,提供了一种设备,包括一个或多个处理器;以及存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现根据本公开内容的第一方面的方法。在本公开内容的第四方面中,提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现根据本公开内容的第一方面的方法。应当理解,
技术实现思路
部分中所描述的内容并非旨在限定本公开内容的实施方式的关键或重要特征,亦非用于限制本公开内容的范围。本公开内容的其他特征将通过以下的描述变得容易理解。附图说明结合附图并参考以下详细说明,本公开内容的各实施方式的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素,其中:图1图示了根据本公开的实施方式的设备和/或方法可以在其中被实施的示例环境的示意图;图2图示了根据本公开的实施方式的用于识别图像中的表格内的字符的方法的流程图;图3图示了根据本公开的实施方式的用于的确定内容点的方法的流程图;图4图示了根据本公开的实施方式的用于确定斜率的方法的流程图;图5图示了根据本公开的实施方式的确定预定义直线的示例图;图6图示了根据本公开的实施方式的用于对图像进行旋转的方法的流程图;图7图示了根据本公开的实施方式的用于识别单元格及字符的方法的流程图;图8图示了根据本公开的实施方式的确定水平表格线位置的示例图;图9示意性示出了根据本公开内容的示例性实施方式的用于识别图像中的表格内字符的装置的框图;以及图10示出了能够实施本公开内容的多个实施方式的计算设备的框图。具体实施方式下面将参照附图更详细地描述本公开内容的实施方式。虽然附图中显示了本公开内容的某些实施方式,然而应当理解的是,本公开内容可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施方式,相反提供这些实施方式是为了更加透彻和完整地理解本公开内容。应当理解的是,本公开内容的附图及实施方式仅用于示例性作用,并非用于限制本公开内容的保护范围。在本公开内容的实施方式的描述中,术语“包括”及其类似用语应当理解为开放性包含,即“包括但不限于”。术语“基于”应当理解为“至少部分地基于”。术语“一个实施方式”或“该实施方式”应当理解为“至少一个实施方式”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。传统的OCR技术一般会在整幅图像上使用字符图像模板进行匹配,图像越大则识别的速度越低。于在扫描图表时,由于图表放置的位置可能并不平行于设备,使得扫描后的图像中表格与图像的边线并不是平行的,而是可能呈一定的倾斜角度,即图像中的表格是倾斜的。这种倾斜将会导致在图像识别时并不能准确的识别表格中的文字。为了解决上述问题,本文提出一种用于识别图像中的表格内的字符的方法。在该方法中,首先将图像设置成图像单元,然后对图像单元进行旋转调整,在调整后的图像单元内进行OCR识别。以此方式,不仅可以加快OCR识别的速度,而且可以利用单元内文字上下文信息,使得识别的准确率更高。在图1中示出了根据本公开的实施方式的设备和/或方法可以在其中被实施的示例环境100的示意图。系统100包括字符识别设备102。字符识别设备102包括控制器104和存储装置106。字符识别设备102用于识别图像中的表格内的字符的装置。在一个示例中,该图像可以来自于其他计算设备,诸如扫描仪108、智能手机110或外部存储设备112等。在另一个示例中,该图像可以由字符识别设备102本身获取。在又一示例中,图像是通过网络获得的。字符识别设备102包括但不限于个人计算机、膝上型计算机、车载计算机(例如,导航单元)、膝上型计算机、便携式数字助理(PDA)等。控制器104用于控制监视设备的各种操作。在一个示例中,控制器104可以包括硬件处理器,其包括但不限于硬件中央处理单元(CPU)、现场可编程门阵列(FPGA)、复合可编程逻辑器件(CPLD)、专用集成电路(ASIC)、片上系统(SoC)或其组合。字符识别设备102用于对获取的图像进行识别,在识别图像的数据后将识别的信息返回或发送到其他的设备或装置进行处理。在上文中已经参见图1描述了监视设备运行的工作环境,在下文中将参见图2中详细介绍用于识别图像中的表格内的字符的方法。字符识别设备102在获取到带有表格的图像后,如图2所示,在202处,识别图像中的一组内容点。在一个示例中,该内容点表示与表格的边或字符相关联的像素点。由于需要对图像进行识别,因此需要识别其中图表的框。在识别到包括边框的内容点后,需要进一步确定图像中的表格的边相对于图像的边线的倾斜程度或倾斜角度。在框204处,基于上述一组内容点与图像中的一组预定义直线之间的位置关系,确定表格的边相对于图像的边线的斜率。为了确定图像中表格的倾斜程序,在识别过程中为其设置一些预定义的直线。然后基于这些内容点与预定义的直线之间的位置关系来确定内容点更接近或位于哪些直线上,从而基于该直线的斜率来确定表格的边相对于图像的边的斜率。在框206处,在确定好表格的边相对于图像的边之后,可以基于斜率来将表格调整为与边线平行。在一个示例中,基于获得的斜率将图像旋转预定角度来调整图像中的内容。在另一个示例中,依据需要设置合适的算法对图像进行调本文档来自技高网
...

【技术保护点】
1.一种用于识别图像中的表格内的字符的方法,所述方法包括:识别所述图像中的一组内容点,所述内容点表示与所述表格的边或所述字符相关联的像素点;基于所述一组内容点与所述图像中的一组预定义直线之间的位置关系,确定所述表格的所述边相对于所述图像的边线的斜率;基于所述斜率来将所述表格调整为与所述边线平行;以及获取经调整的所述表格内的字符。

【技术特征摘要】
1.一种用于识别图像中的表格内的字符的方法,所述方法包括:识别所述图像中的一组内容点,所述内容点表示与所述表格的边或所述字符相关联的像素点;基于所述一组内容点与所述图像中的一组预定义直线之间的位置关系,确定所述表格的所述边相对于所述图像的边线的斜率;基于所述斜率来将所述表格调整为与所述边线平行;以及获取经调整的所述表格内的字符。2.根据权利要求1所述的方法,其中识别所述图像中的所述一组内容点包括:将所述图像中的像素点的像素值进行排序;基于排序的像素点中的一部分像素点的像素值确定阈值像素值;以及针对所述图像中的特定像素点,响应于所述特定像素点的像素值低于所述阈值像素值,将所述特定像素点标识为内容点。3.根据权利要求2所述的方法,其中基于排序的像素点中的一部分像素点的像素值确定阈值像素值包括:在排序的像素点中选择一组像素点;以及基于选择的所述一组像素点的像素值的平均值确定所述阈值像素值。4.根据权利要求1所述的方法,其中确定所述斜率包括:统计与所述一组预定义直线中的预定义直线之间的距离满足预定条件的所述图像中的像素点的数量;以及基于所述一组预定义直线中的与最大数量相关联的预定义直线的斜率,确定所述斜率。5.根据权利要求4所述的方法,进一步包括获取所述一组预定义直线,包括:获取不高于所述图像的阈值斜率的一组斜率,所述阈值斜率是基于所述图像的高度和宽度比而确定的;获取不高于所述图像的高度的一组偏移值;以及基于所述一组斜率和所述一组偏移值定义所述一组预定义直线。6.根据权利要求1所述的方法,其中基于所述斜率来将所述表格调整为与所述边线平行包括:基于所述斜率确定所述表格的所述边相对于所述图像的所述边线的倾斜角度;以及基于所述倾斜角度对图像进行旋转。7.根据权利要求1所述的方法,其中获取经调整的所述表格内的所述字符包括:在经调整的所述图像内,分别确定所述表格的水平表格线和垂直表格线;基于确定的所述水平表格线和垂直表格线来确定所述表格的表格单元;以及识别所述表格单元内的字符。8.根据权利要求7所述的方法,其中确定所述水平表格线包括:获取经调整的所述图像内的像素点在水平方向上的累积像素值;以及基于所述累积像素值确定所述水平表格线。9.根据权利要求7所述的方法,其中确定所述垂直表格线包括:获取经调整的所述图像内的像素点在垂直方向上的累积像素值;以及基于所述累积像素值确定所述垂直表格线。10.一种用于识别图像中的表格内的字符的装置,所述装置包括:识别模块,所述识别模块被配置为识别所述图像中的一组内容点,所述内容点表示与所述表格的边或所述字符相关联的像素点;斜率确定模块,所述斜率确定模块被配置为基于所述一组内容点与所述图像中的一组预定义直线之间的位置关系,确定所述表格的所述边相对于所述图像的边线的斜率;调整模块,所述调整模块被配置为基于所述斜率来将所述表格调整为与所述边线平行;以及获取模块,所述获取模块被配置为获取经调整的所述表格内的字符。11.根据权利要求10所述的装置,其中所述识别模块包括:排序模块,所述排序模块被配置为将所述图像中的像素点的像素值进行排序;阈值像素值确定模块,所述阈值像素值确定模块被配置为基于排序的像素点中的一部分像素点的像素值确定阈...

【专利技术属性】
技术研发人员:徐作新方胜
申请(专利权)人:兴业数字金融服务上海股份有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1