用于识别图像的方法、装置、设备和计算机存储介质制造方法及图纸

技术编号：21892739 阅读：25 留言：0更新日期：2019-08-17 14:50

根据本公开内容的示例性实现方式，提供了一种用于识别图像的方法、装置、设备和计算机存储介质。具体地，提供了一种用于识别图像的方法，包括：获取表格图像，该表格图像包含表格线和表格内容，该表格线与该表格内容中的多个字段相关联；基于该表格图像，识别该表格线；基于所识别的表格线，将该表格图像划分为多个区域；以及基于所划分的该多个区域，识别该多个字段的内容。根据本公开内容的示例性实现方式，还提供了用于识别图像相应的装置、设备和计算机存储介质。

Methods, devices, equipment and computer storage media for image recognition

全部详细技术资料下载

【技术实现步骤摘要】
用于识别图像的方法、装置、设备和计算机存储介质
技术实现思路
本公开的实施例总体涉及图像识别，具体涉及识别表格图像中的表格线的方法、装置、设备和计算机存储介质。
技术实现思路
表格是组织数据的可视化形式。长期以来，已经广泛采用各种纸质形式的表格以支持通信交流、科学研究以及数据分析等活动。例如，诸如资产负债表、现金流量表、利润表等的企业财务报表可以用于表示企业在特定时期的经营状况，并且可以用于向金融机构提供信贷审批的决策依据。随着办公数字化技术的发展，需要将现有的纸质表格转换为电子表格的形式。因此，为了更准确地传达表格中所包含的信息，需要改进用于识别表格图像的技术。
技术实现思路
根据本公开内容的示例实施例，提供了一种用于识别图像的方案。在本公开内容的第一方面中，提供了一种用于识别图像的方法。具体地，该方法包括：获取表格图像，该表格图像包含表格线和表格内容，该表格线与该表格内容中的多个字段相关联；基于该表格图像，识别该表格线；基于所识别的表格线，将该表格图像划分为多个区域；以及基于所划分的该多个区域，识别该多个字段的内容。在本公开内容的第二方面中，提供了一种用于识别图像的装置。具体地，该装置包括：获取模块，该获取模块被配置为获取表格图像，该表格图像包含表格线和表格内容，该表格线与该表格内容中的多个字段相关联；表格线识别模块，该表格线识别模块被配置为基于该表格图像，识别该表格线；划分模块，该划分模块被配置为基于所识别的表格线，将该表格图像划分为多个区域；以及字段识别模块，该字段识别模块被配置为基于所划分的该多个区域，识别该多个字段的内容。在本公开内容的第三方面中，提供了一种...

【技术保护点】
1.一种用于识别图像的方法，包括：获取表格图像，所述表格图像包含表格线和表格内容，所述表格线与所述表格内容中的多个字段相关联；基于所述表格图像，识别所述表格线；基于所识别的表格线，将所述表格图像划分为多个区域；以及基于所划分的所述多个区域，识别所述多个字段的内容。

【技术特征摘要】
1.一种用于识别图像的方法，包括：获取表格图像，所述表格图像包含表格线和表格内容，所述表格线与所述表格内容中的多个字段相关联；基于所述表格图像，识别所述表格线；基于所识别的表格线，将所述表格图像划分为多个区域；以及基于所划分的所述多个区域，识别所述多个字段的内容。2.根据权利要求1所述的方法，其中识别所述表格线包括：对所述表格图像进行二值化以生成二值图像；对所述二值图像进行霍夫变换以生成针对所述二值图像的霍夫空间；确定所述霍夫空间中的极值点；以及基于所述极值点，确定所述表格线。3.根据权利要求2所述的方法，其中生成所述二值图像包括：对所述表格图像进行降噪以生成经降噪的表格图像；以及对所述经降噪的表格图像进行二值化以生成二值图像。4.根据权利要求2所述的方法，其中生成所述二值图像包括：对所述表格图像应用边缘检测以生成经边缘检测的表格图像；以及对所述经边缘检测的表格图像进行二值化以生成所述二值图像。5.根据权利要求2所述的方法，其中确定所述极值点包括：获取与所述极值点的特征有关的预定阈值，所述特征包括所述极值点的数目和所述极值点的大小中的任一项；以及基于所述预定阈值确定所述极值点。6.根据权利要求1所述的方法，其中将所述表格图像划分为多个区域包括：基于所述表格线在所述表格图像中的坐标，将所述表格图像划分为所述多个区域，所述多个区域中的每个区域对应于所述多个字段中的每个字段。7.根据权利要求6所述的方法，其中识别所述多个字段的所述内容包括：针对所述多个区域中的一个区域，通过识别所述区域中的内容，确定所述多个字段中的与所述区域对应的字段的内容。8.一种用于识别图像的装置，包括：获取模块，所述获取模块被配置为获取表格图像，所述表格图像包含表格线和表格内容，所述表格线与所述表格内容中的多个字段相关联；表格线识别模块，所述表格线识别模块被配置为基于所述表格图像，识别所述表格线；划分模块，所述划分模块被配置为基于所识别的表格线，将所述表格图像划分为多个区域；以及字段识别模块，所述字段识别模块被配置为基于所划分的所述多个区域，识别所述多个字段的内容。9.根据权利要求8所述的装置，其中所述表格线识别模块包括：二值化模块，所述...

【专利技术属性】
技术研发人员：陈文彬，陈诗名，
申请(专利权)人：兴业数字金融服务上海股份有限公司，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人