用于识别图像的方法、装置、设备和计算机存储介质制造方法及图纸

技术编号:21892739 阅读:25 留言:0更新日期:2019-08-17 14:50
根据本公开内容的示例性实现方式,提供了一种用于识别图像的方法、装置、设备和计算机存储介质。具体地,提供了一种用于识别图像的方法,包括:获取表格图像,该表格图像包含表格线和表格内容,该表格线与该表格内容中的多个字段相关联;基于该表格图像,识别该表格线;基于所识别的表格线,将该表格图像划分为多个区域;以及基于所划分的该多个区域,识别该多个字段的内容。根据本公开内容的示例性实现方式,还提供了用于识别图像相应的装置、设备和计算机存储介质。

Methods, devices, equipment and computer storage media for image recognition

【技术实现步骤摘要】
用于识别图像的方法、装置、设备和计算机存储介质
技术实现思路
本公开的实施例总体涉及图像识别,具体涉及识别表格图像中的表格线的方法、装置、设备和计算机存储介质。
技术实现思路
表格是组织数据的可视化形式。长期以来,已经广泛采用各种纸质形式的表格以支持通信交流、科学研究以及数据分析等活动。例如,诸如资产负债表、现金流量表、利润表等的企业财务报表可以用于表示企业在特定时期的经营状况,并且可以用于向金融机构提供信贷审批的决策依据。随着办公数字化技术的发展,需要将现有的纸质表格转换为电子表格的形式。因此,为了更准确地传达表格中所包含的信息,需要改进用于识别表格图像的技术。
技术实现思路
根据本公开内容的示例实施例,提供了一种用于识别图像的方案。在本公开内容的第一方面中,提供了一种用于识别图像的方法。具体地,该方法包括:获取表格图像,该表格图像包含表格线和表格内容,该表格线与该表格内容中的多个字段相关联;基于该表格图像,识别该表格线;基于所识别的表格线,将该表格图像划分为多个区域;以及基于所划分的该多个区域,识别该多个字段的内容。在本公开内容的第二方面中,提供了一种用于识别图像的装置。具体地,该装置包括:获取模块,该获取模块被配置为获取表格图像,该表格图像包含表格线和表格内容,该表格线与该表格内容中的多个字段相关联;表格线识别模块,该表格线识别模块被配置为基于该表格图像,识别该表格线;划分模块,该划分模块被配置为基于所识别的表格线,将该表格图像划分为多个区域;以及字段识别模块,该字段识别模块被配置为基于所划分的该多个区域,识别该多个字段的内容。在本公开内容的第三方面中,提供了一种设备,包括一个或多个处理器;以及存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现根据本公开内容的第一方面的方法。在本公开内容的第四方面中,提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现根据本公开内容的第一方面的方法。应当理解,
技术实现思路
部分中所描述的内容并非旨在限定本公开内容的实施例的关键或重要特征,亦非用于限制本公开内容的范围。本公开内容的其它特征将通过以下的描述变得容易理解。附图说明结合附图并参考以下详细说明,本公开内容的各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素,其中:图1示出了将被处理的表格图像的示意图;图2示出了根据本公开内容的示例性实施例的用于识别图像的方法的流程图;图3示出了根据本公开内容的示例性实施例的针对表格图像的霍夫空间的示意图;图4示出了根据本公开内容的示例性实施例的霍夫空间中的极值点的示意图;图5示出了根据本公开内容的示例性实施例的所识别的表格线的示意图;图6示出了根据本公开内容的示例性实施例的具有所识别的表格线的表格图像的示意图;图7示意性示出了根据本公开内容的示例性实施例的用于识别表格图像的装置的框图;以及图8示出了能够实施本公开内容的多个实施例的计算设备的框图。具体实施方式下面将参照附图更详细地描述本公开内容的实施例。虽然附图中显示了本公开内容的某些实施例,然而应当理解的是,本公开内容可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开内容。应当理解的是,本公开内容的附图及实施例仅用于示例性作用,并非用于限制本公开内容的保护范围。在本公开内容的实施例的描述中,术语“包括”及其类似用语应当理解为开放性包含,即“包括但不限于”。术语“基于”应当理解为“至少部分地基于”。术语“一个实施例”或“该实施例”应当理解为“至少一个实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。传统上,表格图像可以通过诸如光学字符识别(OpticalCharacterRecognition,OCR)而被转换为计算机可处理形式的表格,以供诸如文字处理软件、电子表格软件等的软件进一步处理。然而,表格图像中的表格线容易使得表格内容不清楚,从而难以准确识别表格图像。例如,图1示出了将被处理的表格图像100的示意图。表格图像100包括多个字段组1101-110N,其中N为大于1的自然数。字段组1101-110N分别包括多个字段,并且每个字段包括相应的字段内容。例如,字段组1101包括字段11011-1101M,并且字段组110N包括字段110N1-110NK,其中M和K为大于1的自然数。虽然在图1中将字段1101M和110NK示出为对齐(即M=K),但是应理解,在其他实施例中,字段1101M可以与字段110NK不对齐(即M≠K)。此外,还应理解,字段内容可以为空。如图1所示,待处理的表格图像中可能会存在如下情况,表格图像100中的表格线与字段11011和11012中的字段内容重叠,从而使得字段11011和11012不清楚。此时,表格转换系统在将表格图像100转换为计算机可处理形式的表格时,可能将字段11011和11012的字段内容都识别作为字段11012的字段内容,或者出现其他的错误。进一步,表格线还容易使得所识别的字段内容不准确,从而降低了识别表格图像的准确度。为了至少部分地解决上述问题以及其他潜在问题中的一个或者多个问题,本公开的示例实施例提出了一种用于识别图像的方案。该方案在识别表格图像100中的表格内容之前识别表格图像100中的表格线,基于所识别的表格线将表格图像100划分为与表格内容中的多个字段相对应的多个区域,继而通过识别区域中的内容来识别字段的内容。以此方式,即使在表格线使得表格内容不清楚的情况下,也可以更为快速、准确和有效地识别表格图像100中的表格内容,从而提高表格转换系统的准确性。图2示出了根据本公开内容的示例性实施例的用于识别图像的方法200的流程图。例如,该方法200可以由表格转换系统来执行。应当理解的是,该方法200还可以包括未示出的附加步骤和/或可以省略所示出的步骤,本公开的范围在此方面不受限制。在210,表格转换系统获取表格图像100。在某些实施例中,表格转换系统可以从诸如相机、扫描仪、智能电话等可以用于获取表格的图像的各种设备获取表格图像100。例如,表格转换系统可以从扫描仪获取针对企业财务报表的表格图像。表格图像100可以包含表格线和表格内容。表格线与表格内容中的多个字段相关联。例如,表格内容中的多个字段可以通过表格线而被区分。在220,表格转换系统可以基于所获取的表格图像100,识别表格图像100中的表格线。在某些实施例中,表格转换系统可以对表格图像100进行二值化以生成二值图像。在某些实施例中,表格转换系统可以对表格图像100进行灰度化以生成经灰度化的表格图像。对表格图像100进行灰度化可以去除表格图像的颜色,而仅保留表格图像的亮度。然后,表格转换系统可以对经灰度化的表格图像进行二值化以生成二值图像。例如,表格转换系统可以基于预定灰度阈值将经灰度化的表格图像中的像素转换为灰度值仅被设置为例如0或255的像素,从而生成二值图像。在某些实施例中,表格转换系统可以对表格图像100进行降噪以生成经降噪的表格图像,然后对经降噪的表格图像进行二值化以生成二值图像。对表格图像100进行降本文档来自技高网
...

【技术保护点】
1.一种用于识别图像的方法,包括:获取表格图像,所述表格图像包含表格线和表格内容,所述表格线与所述表格内容中的多个字段相关联;基于所述表格图像,识别所述表格线;基于所识别的表格线,将所述表格图像划分为多个区域;以及基于所划分的所述多个区域,识别所述多个字段的内容。

【技术特征摘要】
1.一种用于识别图像的方法,包括:获取表格图像,所述表格图像包含表格线和表格内容,所述表格线与所述表格内容中的多个字段相关联;基于所述表格图像,识别所述表格线;基于所识别的表格线,将所述表格图像划分为多个区域;以及基于所划分的所述多个区域,识别所述多个字段的内容。2.根据权利要求1所述的方法,其中识别所述表格线包括:对所述表格图像进行二值化以生成二值图像;对所述二值图像进行霍夫变换以生成针对所述二值图像的霍夫空间;确定所述霍夫空间中的极值点;以及基于所述极值点,确定所述表格线。3.根据权利要求2所述的方法,其中生成所述二值图像包括:对所述表格图像进行降噪以生成经降噪的表格图像;以及对所述经降噪的表格图像进行二值化以生成二值图像。4.根据权利要求2所述的方法,其中生成所述二值图像包括:对所述表格图像应用边缘检测以生成经边缘检测的表格图像;以及对所述经边缘检测的表格图像进行二值化以生成所述二值图像。5.根据权利要求2所述的方法,其中确定所述极值点包括:获取与所述极值点的特征有关的预定阈值,所述特征包括所述极值点的数目和所述极值点的大小中的任一项;以及基于所述预定阈值确定所述极值点。6.根据权利要求1所述的方法,其中将所述表格图像划分为多个区域包括:基于所述表格线在所述表格图像中的坐标,将所述表格图像划分为所述多个区域,所述多个区域中的每个区域对应于所述多个字段中的每个字段。7.根据权利要求6所述的方法,其中识别所述多个字段的所述内容包括:针对所述多个区域中的一个区域,通过识别所述区域中的内容,确定所述多个字段中的与所述区域对应的字段的内容。8.一种用于识别图像的装置,包括:获取模块,所述获取模块被配置为获取表格图像,所述表格图像包含表格线和表格内容,所述表格线与所述表格内容中的多个字段相关联;表格线识别模块,所述表格线识别模块被配置为基于所述表格图像,识别所述表格线;划分模块,所述划分模块被配置为基于所识别的表格线,将所述表格图像划分为多个区域;以及字段识别模块,所述字段识别模块被配置为基于所划分的所述多个区域,识别所述多个字段的内容。9.根据权利要求8所述的装置,其中所述表格线识别模块包括:二值化模块,所述...

【专利技术属性】
技术研发人员:陈文彬陈诗名
申请(专利权)人:兴业数字金融服务上海股份有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1