表格图像单元格行列信息索引方法、计算机装置及存储介质制造方法及图纸

技术编号:37477465 阅读:11 留言:0更新日期:2023-05-07 09:18
本发明专利技术提供一种表格图像单元格行列信息索引方法、计算机装置及存储介质,该方法包括:识别表格图像中的所有单元格,获取每个单元格四个顶点的坐标;根据所有单元格的四个顶点的坐标分别生成代表单元格上横线的上横线坐标集合、代表单元格下横线的下横线坐标集合、代表单元格左纵线的左纵线坐标集合和代表单元格右纵线的右纵线坐标集合;确定每一个单元格的行动态阈值和列动态阈值;根据上横线坐标集合、下横线坐标集合、左纵线坐标集合、右纵线坐标集合、行动态阈值和列动态阈值确定每个单元格的行起始索引、行终止索引、列起始索引和列终止索引。应用本发明专利技术的表格图像单元格行列信息索引方法可划分单元格所属具体行列,涵盖索引信息更加全面。引信息更加全面。引信息更加全面。

【技术实现步骤摘要】
表格图像单元格行列信息索引方法、计算机装置及存储介质


[0001]本专利技术涉及图像处理
,具体的,涉及一种表格图像单元格行列信息索引方法,还涉及应用该表格图像单元格行列信息索引方法的计算机装置,还涉及应用该表格图像单元格行列信息索引方法的计算机可读存储介质。

技术介绍

[0002]表格是各类文档中常见的对象,其结构化的组织形式方便人们进行信息理解和提取。表格的种类根据有无边框可以划分有线表、少线表、无线表。表格样式复杂多样,如存在背景填充、光照阴影、单元格行列合并等情况。大数据时代存在大量电子表格图像文档,应用表格识别技术能够减少表格处理时间,因此表格识别是文档理解领域的重要研究课题。在表格中,大多数表格都存在合并单元格情况,对于某些表格由于某一列过窄,而该列某个单元格内容远长于该列其他单元格,则会导致该单元格需要换行,需要使用多行单元格显示内容。目前的表格识别算法在检测识别表格过程中,检测出表格之后,只是用简单的索引标注或者进一步利用复杂的序列标签,并不能反映出合并的单元格,对于存在多行或多列合并单元格的表格或无表格线的表格更是标注混乱,导致使用者或后续程序开发人员对表格单元格信息无法直接获取,影响表格使用体验或程序开发效率,因此,需要更加优化的单元格索引计算方法。

技术实现思路

[0003]本专利技术的第一目的是提供一种可划分单元格所属具体行列,涵盖索引信息更加全面的表格图像单元格行列信息索引方法。
[0004]本专利技术的第二目的是提供一种可划分单元格所属具体行列,涵盖索引信息更加全面的计算机装置。
[0005]本专利技术的第三目的是提供一种可划分单元格所属具体行列,涵盖索引信息更加全面的计算机可读存储介质。
[0006]为了实现上述第一目的,本专利技术提供的表格图像单元格行列信息索引方法包括:识别表格图像中的所有单元格,获取每个单元格四个顶点的坐标;根据所有单元格的四个顶点的坐标分别生成代表单元格上横线的上横线坐标集合、代表单元格下横线的下横线坐标集合、代表单元格左纵线的左纵线坐标集合和代表单元格右纵线的右纵线坐标集合;根据每一个单元格的左纵线或右纵线的长度确定该单元格的行动态阈值,根据每一个单元格的上横线或下横线的长度确定该单元格的列动态阈值;将每一个单元格的上横线坐标依次与上横线坐标集合中的上横线坐标求差,将获得差值绝对值小于行动态阈值所对应的上横线作为该单元格的行起始索引,将每一个单元格的下横线坐标依次与下横线坐标集合中的下横线坐标求差,将获得差值绝对值小于行动态阈值所对应的下横线作为该单元格的行终止索引,将每一个单元格的左纵线坐标依次与左纵线坐标集合中的左纵线坐标求差,将获得差值绝对值小于列动态阈值所对应的左纵线作为该单元格的列起始索引,将每一个单元
格的右纵线坐标依次与右纵线坐标集合中的右纵线坐标求差,将获得差值绝对值小于列动态阈值所对应的右纵线作为该单元格的列终止索引。
[0007]由上述方案可见,本专利技术的表格图像单元格行列信息索引方法通过在识别表格图像中的所有单元格后,根据单元格的宽、高设置动态阈值,从而确定单元格所属的行、列索引信息,可以避免设置固定阈值漏掉行列信息,很好地划分单元格所属具体行列,涵盖索引信息更加全面,计算量小,逻辑简单,实现起来更加方便。
[0008]进一步的方案中,根据所有单元格的四个顶点的坐标分别生成代表单元格上横线的上横线坐标集合、代表单元格下横线的下横线坐标集合、代表单元格左纵线的左纵线坐标集合和代表单元格右纵线的右纵线坐标集合的步骤包括:将所有单元格的左上顶点的横坐标进行聚类分析,获得表格中每一个左纵线的左纵线坐标,以坐标值大小升序排序,获得左纵线坐标集合;将所有单元格的右上顶点的横坐标进行聚类分析,获得表格中每一个右纵线的右纵线坐标,以坐标值大小升序排序,获得右纵线坐标集合;将所有单元格的左上顶点的纵坐标进行聚类分析,获得表格中每一个上横线的上横线坐标,以坐标值大小升序排序,获得上横线坐标集合;将所有单元格的左下顶点的纵坐标进行聚类分析,获得表格中每一个下横线的下横线坐标,以坐标值大小升序排序,获得代表单元格下横线的下横线坐标集合。
[0009]由此可见,通过对坐标进行聚类分析,并以坐标值大小升序排序,可确定表格中存在横线和纵线的数量,便于后续确认单元格的行列索引。
[0010]进一步的方案中,根据每一个单元格的左纵线或右纵线的长度确定该单元格的行动态阈值的步骤包括:若单元格的左纵线或右纵线的一半长度处于第一预设范围内,则将单元格的左纵线或右纵线的一半长度作为行动态阈值;若单元格的左纵线或右纵线的一半长度大于第一预设范围的上限值,则将第一预设范围的上限值作为行动态阈值;若单元格的左纵线或右纵线的一半长度小于第一预设范围的下限值,则将第一预设范围的下限值作为行动态阈值。
[0011]由此可见,通过第一预设范围对单元格的左纵线或右纵线的一半长度进行判断,从而确定行动态阈值,可避免行动态阈值过大或过小的问题,提高单元格中行索引的精度。
[0012]进一步的方案中,根据每一个单元格的上横线或下横线的长度确定该单元格的列动态阈值的步骤包括:若单元格的上横线或下横线的一半长度处于第二预设范围内,则将单元格的上横线或下横线的一半长度作为列动态阈值;若单元格的上横线或下横线的一半长度大于第二预设范围的上限值,则将第二预设范围的上限值作为列动态阈值;若单元格的上横线或下横线的一半长度小于第二预设范围的下限值,则将第二预设范围的下限值作为列动态阈值。
[0013]由此可见,通过第二预设范围对单元格的上横线或下横线的一半长度进行判断,从而确定列动态阈值,可避免列动态阈值过大或过小的问题,提高单元格中列索引的精度。
[0014]进一步的方案中,识别表格图像中的所有单元格的步骤包括:识别表格图像中所有的表格线;利用图像连通区域分析方法,划分出各个单元格。
[0015]由此可见,通过图像连通区域分析方法划分出表格图像中各个单元格,可提高表格识别速度。
[0016]进一步的方案中,识别表格图像中所有的表格线的步骤后,还包括:对所有表格线
进行去重处理。
[0017]由此可见,为了避免图像识别出来的线条中,将一条线条识别成多条线条,因此,需要对所有表格线进行去重处理,从而提高表格的识别精度。
[0018]进一步的方案中,对所有表格线进行去重处理的步骤包括:若任意两条横线之间的距离小于预设距离,则将两条横线合并为一条横线;若任意两条纵线之间的距离小于预设距离,则将两条纵线合并为一条纵线。
[0019]由此可见,通过判断两条线之间的距离是否小于预设距离,从而确定两条线是否重合。
[0020]进一步的方案中,识别表格图像中的所有单元格的步骤前,还包括:对表格图像进行角度识别,进行图像角度校正。
[0021]由此可见,由于获取表格图像时,可能会存在角度不正的问题,对表格图像进行角度识别并进行图像角度校正,可有利于后续表格的识别。
[0022]为了实现本专利技术的第二目的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种表格图像单元格行列信息索引方法,其特征在于,包括:识别表格图像中的所有单元格,获取每个所述单元格四个顶点的坐标;根据所有所述单元格的四个顶点的坐标分别生成代表单元格上横线的上横线坐标集合、代表单元格下横线的下横线坐标集合、代表单元格左纵线的左纵线坐标集合和代表单元格右纵线的右纵线坐标集合;根据每一个所述单元格的左纵线或右纵线的长度确定该单元格的行动态阈值,根据每一个所述单元格的上横线或下横线的长度确定该单元格的列动态阈值;将每一个所述单元格的上横线坐标依次与上横线坐标集合中的上横线坐标求差,将获得差值绝对值小于所述行动态阈值所对应的上横线作为该单元格的行起始索引,将每一个所述单元格的下横线坐标依次与下横线坐标集合中的下横线坐标求差,将获得差值绝对值小于所述行动态阈值所对应的下横线作为该单元格的行终止索引,将每一个所述单元格的左纵线坐标依次与左纵线坐标集合中的左纵线坐标求差,将获得差值绝对值小于所述列动态阈值所对应的左纵线作为该单元格的列起始索引,将每一个所述单元格的右纵线坐标依次与右纵线坐标集合中的右纵线坐标求差,将获得差值绝对值小于所述列动态阈值所对应的右纵线作为该单元格的列终止索引。2.根据权利要求1所述的表格图像单元格行列信息索引方法,其特征在于:根据所有所述单元格的四个顶点的坐标分别生成代表单元格上横线的上横线坐标集合、代表单元格下横线的下横线坐标集合、代表单元格左纵线的左纵线坐标集合和代表单元格右纵线的右纵线坐标集合的步骤包括:将所有所述单元格的左上顶点的横坐标进行聚类分析,获得表格中每一个左纵线的左纵线坐标,以坐标值大小升序排序,获得所述左纵线坐标集合;将所有所述单元格的右上顶点的横坐标进行聚类分析,获得表格中每一个右纵线的右纵线坐标,以坐标值大小升序排序,获得所述右纵线坐标集合;将所有所述单元格的左上顶点的纵坐标进行聚类分析,获得表格中每一个上横线的上横线坐标,以坐标值大小升序排序,获得所述上横线坐标集合;将所有所述单元格的左下顶点的纵坐标进行聚类分析,获得表格中每一个下横线的下横线坐标,以坐标值大小升序排序,获得所述下横线坐标集合。3.根据权利要求1所述的表格图像单元格行列信息索引方法,其特征在于:根据每一个所述单元格的左纵线或右纵线的长度确定该单元格的行动态阈值的步骤包括:若所述单元格的左纵线...

【专利技术属性】
技术研发人员:朱莹莹薛闯陈志衔吴成军陈子鹏陈家荣
申请(专利权)人:远光软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1