表格类图像的矫正方法及装置、存储介质、计算机设备制造方法及图纸

技术编号:38365178 阅读:9 留言:0更新日期:2023-08-05 17:32
本申请涉及数字医疗及图像处理技术领域,公开了一种表格类图像的矫正方法及装置、存储介质、计算机设备,该方法包括:获取待矫正的初始表格图像;检测所述初始表格图像中包含的至少一条第一直线,依据所述第一直线的直线倾斜角度确定所述初始表格图像的图像倾斜角度,并基于所述初始表格图像的图像倾斜角度对所述初始表格图像进行角度矫正获得第一中间图像;通过朝向分类模型对所述第一中间图像进行分类,并依据所述第一中间图像的朝向对所述第一中间图像进行朝向矫正,获得矫正后的目标图像。本申请通过对初始表格图像进行角度矫正和朝向矫正,使得矫正后的图像中的表格和文字均能保持正向,有助于提升后续对图像进行文字识别的准确性。别的准确性。别的准确性。

【技术实现步骤摘要】
表格类图像的矫正方法及装置、存储介质、计算机设备


[0001]本申请涉及数字医疗和图像处理
,尤其是涉及到一种表格类图像的矫正方法及装置、存储介质、计算机设备。

技术介绍

[0002]在医疗场景下,如果能够准确的对体检报告、检查单和检验单等自动提取相关信息譬如OCR文档识别,可极大的降低人力成本。
[0003]其中,文档图像作为一种非结构化的数据,其分析识别等面临着一些技术难点,其中包括,一是低质量的文档表格类图像识别困难:一些图文混合、区域形状不规则、文档图像模糊不清等问题给图像识别带来极大的困难。二是场景文本的文字检测困难:由于光照强度不一、拍摄角度不同、拍摄工具差异,拍摄视角不同等所导致的用户上传的待解析的图像有不同程度的遮挡、倾斜、褶皱等问题。这些问题也会严重影响后续OCR识别的效果。

技术实现思路

[0004]有鉴于此,本申请提供了一种表格类图像的矫正方法及装置、存储介质、计算机设备,使得矫正后的图像中的表格和文字均能保持正向,有助于提升后续对图像进行文字识别的准确性。
[0005]根据本申请的一个方面,提供了一种表格类图像的矫正方法,所述方法包括:
[0006]获取待矫正的初始表格图像;
[0007]检测所述初始表格图像中包含的至少一条第一直线,依据所述第一直线的直线倾斜角度确定所述初始表格图像的图像倾斜角度,并基于所述初始表格图像的图像倾斜角度对所述初始表格图像进行角度矫正获得第一中间图像;
[0008]通过朝向分类模型对所述第一中间图像进行分类,并依据所述第一中间图像的朝向对所述第一中间图像进行朝向矫正,获得矫正后的目标图像。
[0009]可选地,所述依据所述第一直线的直线倾斜角度确定所述初始表格图像的图像倾斜角度,包括:
[0010]获取每条第一直线的直线倾斜角度;
[0011]统计落入不同倾斜角度区间的第一直线,并依据落入每个倾斜角度区间的第一直线,计算每个倾斜角度区间对应的直线倾斜角度方差;
[0012]获取直线倾斜角度方差最小的倾斜角度区间对应的目标区间落入直线,并依据每条所述目标区间落入直线的直线倾斜角度,确定所述初始表格图像的图像倾斜角度。
[0013]可选地,所述确定所述初始表格图像的图像倾斜角度之后,所述方法还包括:
[0014]若所述初始表格图像的图像倾斜角度在预设扭曲角度范围内,则通过扭曲图像矫正模型对所述初始表格图像进行扭曲矫正获得第二中间图像;
[0015]检测所述第二中间图像中包含的至少一条第二直线,依据所述第二直线的直线倾斜角度确定所述第二中间图像的图像倾斜角度,并基于所述第二中间图像的图像倾斜角度
对所述第二中间图像进行角度矫正获得第三中间图像;
[0016]通过朝向分类模型对所述第三中间图像进行分类,并依据所述第三中间图像的朝向对所述第三中间图像进行朝向矫正,获得矫正后的目标图像。
[0017]可选地,所述确定所述初始表格图像的图像倾斜角度之后,所述方法还包括:
[0018]若所述初始表格图像的图像倾斜角度不在预设扭曲角度范围内,则继续执行所述基于所述初始表格图像的图像倾斜角度对所述初始表格图像进行角度矫正获得第一中间图像;
[0019]相应地,所述通过朝向分类模型对所述第一中间图像进行分类之后,所述方法还包括:
[0020]若所述第一中间图像不是向上朝向,则通过扭曲图像矫正模型对所述初始表格图像进行扭曲矫正获得第四中间图像;
[0021]检测所述第四中间图像中包含的至少一条第三直线,依据所述第三直线的直线倾斜角度确定所述第四中间图像的图像倾斜角度,并基于所述第四中间图像的图像倾斜角度对所述第四中间图像进行角度矫正获得第五中间图像;
[0022]通过朝向分类模型对所述第五中间图像进行分类,并依据所述第五中间图像的朝向对所述第五中间图像进行朝向矫正,获得矫正后的目标图像。
[0023]可选地,所述通过朝向分类模型对所述第一中间图像进行分类之后,所述方法还包括:
[0024]若所述第一中间图像是向上朝向,则将所述第一中间图像作为矫正后的目标图像。
[0025]可选地,所述朝向分类模型的训练过程包括:
[0026]获取向上朝向的多张样本表格图像,并分别对每张所述样本表格图像进行旋转,获得向左朝向、向右朝向以及向下朝向的样本表格图像;
[0027]基于向上朝向、向下朝向、向左朝向以及向右朝向的样本表格图像,构建朝向分类模型的训练样本,并进行朝向分类模型的训练。
[0028]可选地,所述获取待矫正的初始表格图像之后,所述方法还包括:
[0029]确定所述初始表格图像中每个像素点的像素值;
[0030]针对每个像素点,获取该像素点的像素值以及该像素点对应的邻域像素点的像素值,对该像素点的像素值和邻域像素点的像素值进行加权求和,并将加权求和结果作为该像素点的最终像素值;
[0031]基于每个像素点的最终像素值,更新所述初始表格图像。
[0032]根据本申请的另一方面,提供了一种表格类图像的矫正装置,所述装置包括:
[0033]图像获取模块,用于获取待矫正的初始表格图像;
[0034]角度矫正模块,用于检测所述初始表格图像中包含的至少一条第一直线,依据所述第一直线的直线倾斜角度确定所述初始表格图像的图像倾斜角度,并基于所述初始表格图像的图像倾斜角度对所述初始表格图像进行角度矫正获得第一中间图像;
[0035]朝向矫正模块,用于通过朝向分类模型对所述第一中间图像进行分类,并依据所述第一中间图像的朝向对所述第一中间图像进行朝向矫正,获得矫正后的目标图像。
[0036]可选地,所述角度矫正模块,还用于:
[0037]获取每条第一直线的直线倾斜角度;
[0038]统计落入不同倾斜角度区间的第一直线,并依据落入每个倾斜角度区间的第一直线,计算每个倾斜角度区间对应的直线倾斜角度方差;
[0039]获取直线倾斜角度方差最小的倾斜角度区间对应的目标区间落入直线,并依据每条所述目标区间落入直线的直线倾斜角度,确定所述初始表格图像的图像倾斜角度。
[0040]可选地,所述装置还包括:
[0041]扭曲矫正模块,用于若所述初始表格图像的图像倾斜角度在预设扭曲角度范围内,则通过扭曲图像矫正模型对所述初始表格图像进行扭曲矫正获得第二中间图像;
[0042]所述角度矫正模块,还用于检测所述第二中间图像中包含的至少一条第二直线,依据所述第二直线的直线倾斜角度确定所述第二中间图像的图像倾斜角度,并基于所述第二中间图像的图像倾斜角度对所述第二中间图像进行角度矫正获得第三中间图像;
[0043]所述朝向矫正模块,还用于通过朝向分类模型对所述第三中间图像进行分类,并依据所述第三中间图像的朝向对所述第三中间图像进行朝向矫正,获得矫正后的目标图像。
[0044]可选地,所述确角度矫正模块,还用于若所述初始表本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种表格类图像的矫正方法,其特征在于,所述方法包括:获取待矫正的初始表格图像;检测所述初始表格图像中包含的至少一条第一直线,依据所述第一直线的直线倾斜角度确定所述初始表格图像的图像倾斜角度,并基于所述初始表格图像的图像倾斜角度对所述初始表格图像进行角度矫正获得第一中间图像;通过朝向分类模型对所述第一中间图像进行分类,并依据所述第一中间图像的朝向对所述第一中间图像进行朝向矫正,获得矫正后的目标图像。2.根据权利要求1所述的方法,其特征在于,所述依据所述第一直线的直线倾斜角度确定所述初始表格图像的图像倾斜角度,包括:获取每条第一直线的直线倾斜角度;统计落入不同倾斜角度区间的第一直线,并依据落入每个倾斜角度区间的第一直线,计算每个倾斜角度区间对应的直线倾斜角度方差;获取直线倾斜角度方差最小的倾斜角度区间对应的目标区间落入直线,并依据每条所述目标区间落入直线的直线倾斜角度,确定所述初始表格图像的图像倾斜角度。3.根据权利要求1所述的方法,其特征在于,所述确定所述初始表格图像的图像倾斜角度之后,所述方法还包括:若所述初始表格图像的图像倾斜角度在预设扭曲角度范围内,则通过扭曲图像矫正模型对所述初始表格图像进行扭曲矫正获得第二中间图像;检测所述第二中间图像中包含的至少一条第二直线,依据所述第二直线的直线倾斜角度确定所述第二中间图像的图像倾斜角度,并基于所述第二中间图像的图像倾斜角度对所述第二中间图像进行角度矫正获得第三中间图像;通过朝向分类模型对所述第三中间图像进行分类,并依据所述第三中间图像的朝向对所述第三中间图像进行朝向矫正,获得矫正后的目标图像。4.根据权利要求3所述的方法,其特征在于,所述确定所述初始表格图像的图像倾斜角度之后,所述方法还包括:若所述初始表格图像的图像倾斜角度不在预设扭曲角度范围内,则继续执行所述基于所述初始表格图像的图像倾斜角度对所述初始表格图像进行角度矫正获得第一中间图像;相应地,所述通过朝向分类模型对所述第一中间图像进行分类之后,所述方法还包括:若所述第一中间图像不是向上朝向,则通过扭曲图像矫正模型对所述初始表格图像进行扭曲矫正获得第四中间图像;检测所述第四中间图像中包含的至少一条第三直线,依据所述第三直线的直线倾斜角度确定所述...

【专利技术属性】
技术研发人员:张倩李春宇
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1