本发明专利技术公开了一种去除颜色边框的表格裁切方法,包括:获取待处理的图像,待处理的图像包括待提取文字,待提取文字处于至少一个边框中,至少部分至少一个边框的颜色不相同;计算待处理图像的每个像素的色调饱和值,生成色调饱和图像;提取色调饱和图像中对应至少一个边框的至少一个边框色调饱和值;对至少边框色调饱和值进行中值滤波,保留对应最外围边框的最外色调饱和值,生成单边框图像;对单边框图像进行边缘检测,获取二值图像;对二值图像进行轮廓检测,并根据检测结果对单边框图像进行裁切,获取裁切图像;将裁切图像中的最外围边框的颜色替换为白色,生成提取图像。通过上述方式,本发明专利技术能够有效提升工作效率,图像处理设备和存储介质。
【技术实现步骤摘要】
去除颜色边框的表格裁切方法、图像处理设备和存储介质
本专利技术涉及领图像处理域,特别是涉及去除颜色边框的表格裁切方法、图像处理设备和存储介质。
技术介绍
对于OCR(OpticalCharacterRecognition,光学字符识别)表格文字提取中,有一种情况是文字图片里带有颜色表格。对于表格的裁切需要做边框过滤、边缘检测、轮廓检测和裁切这些步骤,然后才能准确提取表格框,为下一步文字识别准备。目前针对颜色边框的表格裁切的应用中,对于不同颜色的边框,都是根据具体颜色,手动设置过滤条件,去除颜色,这样会每次修改内部参数,无法实现自动化处理,这样会产生工作效率低下。
技术实现思路
本专利技术主要解决的技术问题是提供去除颜色边框的表格裁切方法、图像处理设备和存储介质,能够实现对去除颜色边框的表格进行自动裁切,有效提升工作效率。为解决上述技术问题,本专利技术采用的一个技术方案是:提供一种获取待处理的图像,所述待处理的图像包括待提取文字,所述待提取图文字处于至少一个边框中,至少部分所述至少一个边框的颜色不相同;计算所述待处理图像的每个像素的色调饱和值,生成色调饱和图像;提取所述色调饱和图像中对应所述至少一个边框的至少一个边框色调饱和值;对所述至少边框色调饱和值进行中值滤波,保留对应最外围边框的最外色调饱和值,生成单边框图像;对所述单边框图像进行边缘检测,获取二值图像;对所述二值图像进行轮廓检测,并根据检测结果对所述单边框图像进行裁切,获取裁切图像;将所述裁切图像中的所述最外围边框的颜色替换为白色,生成提取图像。其中,所述提取所述色调饱和图像中对应所述至少一个边框的至少一个边框色调饱和值的步骤之后,包括:获取所述至少一个边框色调饱和值的最低值和最高值,根据所述最高值和所述最低值获取所述至少一个边框的对应区域。其中,所述对所述单边框图像进行边缘检测的步骤,包括:采用高斯滤波器对所述单边框图像进行滤波,获取滤波图像;计算所述滤波图像每个像素点的梯度大小和梯度方向;对所述滤波图像进行非极大值抑制,获取抑制图像;采用双阈值法确定所述抑制图像的边缘。其中,所述双阈值法中的最大阈值和最小阈值之差大于100。其中,所述对所述单边框图像进行边缘检测的步骤之后,包括:根据所述最外围边框的宽度和所述最外围边框的行数获取最短线长;在所述边缘检测的图像结果上采用统计概率霍夫直线变换,所述统计概率霍夫直线变换的直线最短长度为所述最短线长。其中,所述对所述二值图像进行轮廓检测的步骤之后,包括:压缩所述轮廓检测的结果水平方向、垂直方向和对角线方向的像素,仅保留水平方向、垂直方向和对角线方向的终点坐标。其中,所述根据检测结果对所述单边框图像进行裁切的步骤,包括:从所述单边框图像的行和列的中心点开始,向左和向右各取等距离的正方形进行裁切。为解决上述技术问题,本专利技术采用的另一个技术方案是:提供一种图像处理设备,包括:获取模块,用于获取待处理的图像,所述待处理的图像包括待提取文字,所述待提取图文字处于至少一个边框中,至少部分所述至少一个边框的颜色不相同;计算模块,用于计算所述待处理图像的每个像素的色调饱和值,生成色调饱和图像;提取模块,用于提取所述色调饱和图像中对应所述至少一个边框的至少一个边框色调饱和值;滤波模块,用于对所述至少边框色调饱和值进行中值滤波,保留对应最外围边框的最外色调饱和值,生成单边框图像;边缘模块,用于对所述单边框图像进行边缘检测,获取二值图像;轮廓模块,用于对所述二值图像进行轮廓检测,并根据检测结果对所述单边框图像进行裁切,获取裁切图像;替换模块,用于将所述裁切图像中的所述最外围边框的颜色替换为白色,生成提取图像。为解决上述技术问题,本专利技术采用的另一个技术方案是:提供一种图像处理设备,包括:处理器和存储器,所述处理器耦接所述存储器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序以实现如上所述的方法。为解决上述技术问题,本专利技术采用的另一个技术方案是:提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序能够被处理器执行以实现如上所述的方法。本专利技术的有益效果是:区别于现有技术的情况,本专利技术引入HSV颜色对照表方法,自动识别对照表对应的颜色,为去除颜色边框的表格裁切提供技术支持,可以实现能够实现对去除颜色边框的表格进行自动裁切,有效提升生工作效率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术提供的去除颜色边框的表格裁切方法的第一实施例的流程示意图;图2是本专利技术提供的去除颜色边框的表格裁切方法的第二实施例的流程示意图图3是本专利技术提供的图像处理设备的第一实施例的结构示意图;图4是本专利技术提供的图像处理设备的第二实施例的结构示意图;图5是本专利技术提供的计算机可读存储介质的一实施例的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参阅图1,图1是本专利技术提供的去除颜色边框的表格裁切方法的第一实施例的流程示意图。本专利技术提供的去除颜色边框的表格裁切方法包括:S101:获取待处理的图像,待处理的图像包括待提取文字,待提取图文字处于至少一个边框中,至少部分至少一个边框的颜色不相同。在一个具体的实施场景中,获取待处理的图像。待处理的图像中包括待提取的文字,待提取的文字处于至少一个边框中,至少一个边框的颜色不同。在提取文字时,需要将该不同颜色的边框去除,以实现对至少一个边框中包含的文字的提取。在本实施场景中,至少一个边框的颜色不同,例如有三个边框,可以是一个边框的颜色和另外两个边框的颜色不同,也可以是三个边框的颜色都相同,即至少一个边框的颜色包括至少两种颜色。S102:计算待处理图像的每个像素的色调饱和值,生成色调饱和图像。在一个具体的实施场景中,计算待处理图像的每个像素的色调饱和值。在本实施场景中,待处理图像为RGB图像转换为HSV(Hue,Saturation,Value)图像。HSV(Hue,Saturation,Value)是根据颜色的直观特性由A.R.Smith在1978年创建的一种颜色空间,也称六角锥体模型(HexconeModel)。这个模型中颜色的参数分别是:色调(H),饱和度(S),亮度(V)。色调H,用角度度量,取值范围为0°~360°,从红色开始按逆时针方向计算,红色为0°,绿色为120°,蓝色为240°。它们的补色是:黄色为60°,青色为180°,品红为300°。饱和度本文档来自技高网...
【技术保护点】
1.一种去除颜色边框的表格裁切方法,其特征在于,包括:/n获取待处理的图像,所述待处理的图像包括待提取文字,所述待提取文字处于至少一个边框中,至少部分所述至少一个边框的颜色不相同;/n计算所述待处理图像的每个像素的色调饱和值,生成色调饱和图像;/n提取所述色调饱和图像中对应所述至少一个边框的至少一个边框色调饱和值;/n对所述至少边框色调饱和值进行中值滤波,保留对应最外围边框的最外色调饱和值,生成单边框图像;/n对所述单边框图像进行边缘检测,获取二值图像;/n对所述二值图像进行轮廓检测,并根据检测结果对所述单边框图像进行裁切,获取裁切图像;/n将所述裁切图像中的所述最外围边框的颜色替换为白色,生成提取图像。/n
【技术特征摘要】
1.一种去除颜色边框的表格裁切方法,其特征在于,包括:
获取待处理的图像,所述待处理的图像包括待提取文字,所述待提取文字处于至少一个边框中,至少部分所述至少一个边框的颜色不相同;
计算所述待处理图像的每个像素的色调饱和值,生成色调饱和图像;
提取所述色调饱和图像中对应所述至少一个边框的至少一个边框色调饱和值;
对所述至少边框色调饱和值进行中值滤波,保留对应最外围边框的最外色调饱和值,生成单边框图像;
对所述单边框图像进行边缘检测,获取二值图像;
对所述二值图像进行轮廓检测,并根据检测结果对所述单边框图像进行裁切,获取裁切图像;
将所述裁切图像中的所述最外围边框的颜色替换为白色,生成提取图像。
2.根据权利要求1所述的方法,其特征在于,所述提取所述色调饱和图像中对应所述至少一个边框的至少一个边框色调饱和值的步骤之后,包括:
获取所述至少一个边框色调饱和值的最低值和最高值,根据所述最高值和所述最低值获取所述至少一个边框的对应区域。
3.根据权利要求1所述的方法,其特征在于,所述对所述单边框图像进行边缘检测的步骤,包括:
采用高斯滤波器对所述单边框图像进行滤波,获取滤波图像;
计算所述滤波图像每个像素点的梯度大小和梯度方向;
对所述滤波图像进行非极大值抑制,获取抑制图像;
采用双阈值法确定所述抑制图像的边缘。
4.根据权利要求3所述的方法,其特征在于,所述双阈值法中的最大阈值和最小阈值之差大于100。
5.根据权利要求3所述的方法,其特征在于,所述对所述单边框图像进行边缘检测的步骤之后,包括:
根据所述最外围边框的宽度和所述最外围边框的行数获取最短线长;
在所述边缘检测的图像结果上采用统计概率霍夫直线变换,...
【专利技术属性】
技术研发人员:李佳,杨阳,刘旭东,
申请(专利权)人:遥相科技发展北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。