去除颜色边框的表格裁切方法、图像处理设备和存储介质技术

技术编号:24889683 阅读:32 留言:0更新日期:2020-07-14 18:16
本发明专利技术公开了一种去除颜色边框的表格裁切方法,包括:获取待处理的图像,待处理的图像包括待提取文字,待提取文字处于至少一个边框中,至少部分至少一个边框的颜色不相同;计算待处理图像的每个像素的色调饱和值,生成色调饱和图像;提取色调饱和图像中对应至少一个边框的至少一个边框色调饱和值;对至少边框色调饱和值进行中值滤波,保留对应最外围边框的最外色调饱和值,生成单边框图像;对单边框图像进行边缘检测,获取二值图像;对二值图像进行轮廓检测,并根据检测结果对单边框图像进行裁切,获取裁切图像;将裁切图像中的最外围边框的颜色替换为白色,生成提取图像。通过上述方式,本发明专利技术能够有效提升工作效率,图像处理设备和存储介质。

【技术实现步骤摘要】
去除颜色边框的表格裁切方法、图像处理设备和存储介质
本专利技术涉及领图像处理域,特别是涉及去除颜色边框的表格裁切方法、图像处理设备和存储介质。
技术介绍
对于OCR(OpticalCharacterRecognition,光学字符识别)表格文字提取中,有一种情况是文字图片里带有颜色表格。对于表格的裁切需要做边框过滤、边缘检测、轮廓检测和裁切这些步骤,然后才能准确提取表格框,为下一步文字识别准备。目前针对颜色边框的表格裁切的应用中,对于不同颜色的边框,都是根据具体颜色,手动设置过滤条件,去除颜色,这样会每次修改内部参数,无法实现自动化处理,这样会产生工作效率低下。
技术实现思路
本专利技术主要解决的技术问题是提供去除颜色边框的表格裁切方法、图像处理设备和存储介质,能够实现对去除颜色边框的表格进行自动裁切,有效提升工作效率。为解决上述技术问题,本专利技术采用的一个技术方案是:提供一种获取待处理的图像,所述待处理的图像包括待提取文字,所述待提取图文字处于至少一个边框中,至少部分所述至少一个边框的颜色不相同;计算所述本文档来自技高网...

【技术保护点】
1.一种去除颜色边框的表格裁切方法,其特征在于,包括:/n获取待处理的图像,所述待处理的图像包括待提取文字,所述待提取文字处于至少一个边框中,至少部分所述至少一个边框的颜色不相同;/n计算所述待处理图像的每个像素的色调饱和值,生成色调饱和图像;/n提取所述色调饱和图像中对应所述至少一个边框的至少一个边框色调饱和值;/n对所述至少边框色调饱和值进行中值滤波,保留对应最外围边框的最外色调饱和值,生成单边框图像;/n对所述单边框图像进行边缘检测,获取二值图像;/n对所述二值图像进行轮廓检测,并根据检测结果对所述单边框图像进行裁切,获取裁切图像;/n将所述裁切图像中的所述最外围边框的颜色替换为白色,生...

【技术特征摘要】
1.一种去除颜色边框的表格裁切方法,其特征在于,包括:
获取待处理的图像,所述待处理的图像包括待提取文字,所述待提取文字处于至少一个边框中,至少部分所述至少一个边框的颜色不相同;
计算所述待处理图像的每个像素的色调饱和值,生成色调饱和图像;
提取所述色调饱和图像中对应所述至少一个边框的至少一个边框色调饱和值;
对所述至少边框色调饱和值进行中值滤波,保留对应最外围边框的最外色调饱和值,生成单边框图像;
对所述单边框图像进行边缘检测,获取二值图像;
对所述二值图像进行轮廓检测,并根据检测结果对所述单边框图像进行裁切,获取裁切图像;
将所述裁切图像中的所述最外围边框的颜色替换为白色,生成提取图像。


2.根据权利要求1所述的方法,其特征在于,所述提取所述色调饱和图像中对应所述至少一个边框的至少一个边框色调饱和值的步骤之后,包括:
获取所述至少一个边框色调饱和值的最低值和最高值,根据所述最高值和所述最低值获取所述至少一个边框的对应区域。


3.根据权利要求1所述的方法,其特征在于,所述对所述单边框图像进行边缘检测的步骤,包括:
采用高斯滤波器对所述单边框图像进行滤波,获取滤波图像;
计算所述滤波图像每个像素点的梯度大小和梯度方向;
对所述滤波图像进行非极大值抑制,获取抑制图像;
采用双阈值法确定所述抑制图像的边缘。


4.根据权利要求3所述的方法,其特征在于,所述双阈值法中的最大阈值和最小阈值之差大于100。


5.根据权利要求3所述的方法,其特征在于,所述对所述单边框图像进行边缘检测的步骤之后,包括:
根据所述最外围边框的宽度和所述最外围边框的行数获取最短线长;
在所述边缘检测的图像结果上采用统计概率霍夫直线变换,...

【专利技术属性】
技术研发人员:李佳杨阳刘旭东
申请(专利权)人:遥相科技发展北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1