一种扫描图像背景的移除方法和装置制造方法及图纸

技术编号:21480158 阅读:25 留言:0更新日期:2019-06-29 05:23
发明专利技术提供了一种扫描图像背景的移除方法,该方法包括,调整预处理图像成满足预定条件的第一图像;将所述第一图像裁剪为第二图像;并对所述第二图像进行三通道处理,得到第一通道图像、第二通道图像和第三通道图像;然后跟进三通道图像的二值化阈值及对应数组调整和替换,最后合成合并,处理完成。从而实现便于人眼阅读,提高OCR识别率,实现了背景移除/平滑的通用性和准确性。

【技术实现步骤摘要】
一种扫描图像背景的移除方法和装置
本专利技术涉及一种扫描图像背景的移除方法和装置。
技术介绍
在将扫描件放置在扫描仪中进行扫描后,得到扫描图像,部分扫描图像带有一定的背景颜色,如发票、宣传单等时常背景会是大面积的背景色;部分扫描图像因保存不当,会存在大量的褶皱,褶皱会被出现在扫描图像中。就产生了背景色和褶皱的去除需要,从而保证图像的清洁。基于目前电子文档化的需求下,且OCR目前无法将图像文档原本的还原到电子档,牵扯到文字识别,版面还原不准确等方面。当前的电子文档大多是基于图像的形式保存,对图像进行背景的移除/平滑,方便人眼的阅读,提高OCR的识别率。针对目前缺少对扫描图像背景的直接移除方法,导致扫描图像使用不便的问题,成为目前亟待解决的技术问题。
技术实现思路
本专利技术的目的是提供一种扫描图像背景的移除方法和装置,以解决目前缺少对扫描图像背景的直接移除方法,导致扫描图像使用不便的问题。为解决上述技术问题,作为本专利技术的一个方面,提供了一种扫描图像背景的移除方法,包括:采集预处理图像的信息,并判断所述信息是否满足预定条件,若不满足预定条件则将所述预处理图像调整成满足预定条件的第一图像;根据所述第一图像的边缘像素值是否大于预定像素总数,若所述边缘像素值占所有边缘像素总数的比例超过预定值,则将所述第一图像裁剪为第二图像;并对所述第二图像进行三通道处理,得到第一通道图像、第二通道图像和第三通道图像;分别计算所述第一通道图像、第二通道图像和第三通道图像的二值化阈值,然后根据阈值调整函数计算得到0-255的数组,数组中不同的二值化阈值分别对应不同颜色值拉伸后的值;遍历所述第一通道图像、第二通道图像和第三通道图像,分别用0-255的数组替换其颜色值;最后将替换后的所述第一通道图像、第二通道图像和第三通道图像合并,处理完成。其中,所述采集预处理图像的信息,并判断所述信息是否满足预定条件,若不满足预定条件则将所述预处理图像调整成满足预定条件的第一图像;步骤中,判断所述预处理图像是否为彩色信息;将所述预处理图像的像素数同预设阈值进行比对,然后缩放得到所述第一图像。其中,所述根据所述第一图像的边缘像素值是否大于预定像素总数,若所述边缘像素值占所有边缘像素总数的比例超过预定值,则将所述第一图像裁剪为第二图像;并对所述第二图像进行三通道处理,得到第一通道图像、第二通道图像和第三通道图像;步骤中,将所述第一图像的四个边缘部分裁剪;将所述第一图像转换为灰色图像,并对所述灰色图像进行自适应二值化得到二值图像,根据所述二值图像求其轮廓集合点;根据所述轮廓集合点坐标和旋转角度,通过放射变换方法裁剪所述第一图像形成所述第二图像,所述第二图像为目标图像。在RGB格式下,将所述第二图像进行三通道处理,得到第一通道图像、第二通道图像和第三通道图像。其中,所述分别计算所述第一通道图像、第二通道图像和第三通道图像的二值化阈值,然后根据阈值调整函数计算得到0-255的数组,数组中不同的二值化阈值分别对应不同颜色值拉伸后的值;步骤中,包括:通过最大类间方差法、基特勒和伊尔林格沃斯法和最大熵法求得每个通道的三组二值化阈值,然后对三组二值化阈值加权得到所述第一通道图像或第二通道图像或第三通道图像的二值化阈值;根据预设三个数组中的值,按照预定的函数得到对应不同颜色值拉伸后的值。其中,所述遍历所述第一通道图像、第二通道图像和第三通道图像,分别用0-255的数组替换其颜色值;最后将替换后的所述第一通道图像、第二通道图像和第三通道图像合并,处理完成;的步骤包括:在RGB格式下,所述第一通道图像、第二通道图像和第三通道图像的像素并列后顺序排列;然后针对不同通道的颜色值采用对应的查找表进行颜色值替换;将替换后的所述第一通道图像、第二通道图像和第三通道图像合并,处理完成。本专利技术还提供一种扫描图像背景的移除装置,包括:调整单元,其配置为,用于采集预处理图像的信息,并判断所述信息是否满足预定条件,若不满足预定条件则将所述预处理图像调整成满足预定条件的第一图像;裁剪单元,其配置为,用于根据所述第一图像的边缘像素值是否大于预定像素总数,若所述边缘像素值占所有边缘像素总数的比例超过预定值,则将所述第一图像裁剪为第二图像;并对所述第二图像进行三通道处理,得到第一通道图像、第二通道图像和第三通道图像;计算单元,其配置为,用于分别计算所述第一通道图像、第二通道图像和第三通道图像的二值化阈值,然后根据阈值调整函数计算得到0-255的数组,数组中不同的二值化阈值分别对应不同颜色值拉伸后的值;合成单元,其配置为,用于遍历所述第一通道图像、第二通道图像和第三通道图像,分别用0-255的数组替换其颜色值;最后将替换后的所述第一通道图像、第二通道图像和第三通道图像合并,处理完成。其中,所述调整单元还包括,判断所述预处理图像是否为彩色信息;将所述预处理图像的像素数同预设阈值进行比对,然后缩放得到所述第一图像。其中,所述裁剪单元还包括,,将所述第一图像的四个边缘部分裁剪;将所述第一图像转换为灰色图像,并对所述灰色图像进行自适应二值化得到二值图像,根据所述二值图像求其轮廓集合点;根据所述轮廓集合点坐标和旋转角度,通过放射变换方法裁剪所述第一图像形成所述第二图像,所述第二图像为目标图像。在RGB格式下,将所述第二图像进行三通道处理,得到第一通道图像、第二通道图像和第三通道图像。其中,所述计算单元还包括:通过最大类间方差法、基特勒和伊尔林格沃斯法和最大熵法求得每个通道的三组二值化阈值,然后对三组二值化阈值加权得到所述第一通道图像或第二通道图像或第三通道图像的二值化阈值;根据预设三个数组中的值,按照预定的函数得到对应不同颜色值拉伸后的值。其中,所述合成单元还包括,在RGB格式下,所述第一通道图像、第二通道图像和第三通道图像的像素并列后顺序排列;然后针对不同通道的颜色值采用对应的查找表进行颜色值替换;将替换后的所述第一通道图像、第二通道图像和第三通道图像合并,处理完成。与现有技术相比,本专利技术的有意效果在于:专利技术提供了一种扫描图像背景的移除方法,调整预处理图像成满足预定条件的第一图像;将所述第一图像裁剪为第二图像;并对所述第二图像进行三通道处理,得到第一通道图像、第二通道图像和第三通道图像;然后跟进三通道图像的二值化阈值及对应数组调整和替换,最后合成合并,处理完成。从而实现便于人眼阅读,提高OCR识别率,实现了背景移除/平滑的通用性和准确性。附图说明图1示意性示出了本专利技术实施例中一种扫描图像背景的移除方法;图2示意性示出了本专利技术实施例中是否裁切条件判断示意图;图3示意性示出了本专利技术实施例中一种扫描图像背景的移除装置的结构示意框图;。具体实施方式以下对本专利技术的实施例进行详细说明,但是本专利技术可以由权利要求限定和覆盖的多种不同方式实施。如图1-图2所示,本专利技术实施例提供提供了一种扫描图像背景的移除方法,包括:步骤一,采集预处理图像的信息,并判断所述信息是否满足预定条件,若不满足预定条件则将所述预处理图像调整成满足预定条件的第一图像;步骤二,根据所述第一图像的边缘像素值是否大于预定像素总数,若所述边缘像素值占所有边缘像素总数的比例超过预定值,则将所述第一图像裁剪为第二图像;并对所述第二图像进行三通道处理,得到第一通道图本文档来自技高网...

【技术保护点】
1.一种扫描图像背景的移除方法,其特征在于,包括:采集预处理图像的信息,并判断所述信息是否满足预定条件,若不满足预定条件则将所述预处理图像调整成满足预定条件的第一图像;根据所述第一图像的边缘像素值是否大于预定像素总数,若所述边缘像素值占所有边缘像素总数的比例超过预定值,则将所述第一图像裁剪为第二图像;并对所述第二图像进行三通道处理,得到第一通道图像、第二通道图像和第三通道图像;分别计算所述第一通道图像、第二通道图像和第三通道图像的二值化阈值,然后根据阈值调整函数计算得到0‑255的数组,数组中不同的二值化阈值分别对应不同颜色值拉伸后的值;遍历所述第一通道图像、第二通道图像和第三通道图像,分别用0‑255的数组替换其颜色值;最后将替换后的所述第一通道图像、第二通道图像和第三通道图像合并,处理完成。

【技术特征摘要】
1.一种扫描图像背景的移除方法,其特征在于,包括:采集预处理图像的信息,并判断所述信息是否满足预定条件,若不满足预定条件则将所述预处理图像调整成满足预定条件的第一图像;根据所述第一图像的边缘像素值是否大于预定像素总数,若所述边缘像素值占所有边缘像素总数的比例超过预定值,则将所述第一图像裁剪为第二图像;并对所述第二图像进行三通道处理,得到第一通道图像、第二通道图像和第三通道图像;分别计算所述第一通道图像、第二通道图像和第三通道图像的二值化阈值,然后根据阈值调整函数计算得到0-255的数组,数组中不同的二值化阈值分别对应不同颜色值拉伸后的值;遍历所述第一通道图像、第二通道图像和第三通道图像,分别用0-255的数组替换其颜色值;最后将替换后的所述第一通道图像、第二通道图像和第三通道图像合并,处理完成。2.根据权利要求1所述的方法,其特征在于,所述采集预处理图像的信息,并判断所述信息是否满足预定条件,若不满足预定条件则将所述预处理图像调整成满足预定条件的第一图像;步骤中,判断所述预处理图像是否为彩色信息;将所述预处理图像的像素数同预设阈值进行比对,然后缩放得到所述第一图像。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一图像的边缘像素值是否大于预定像素总数,若所述边缘像素值占所有边缘像素总数的比例超过预定值,则将所述第一图像裁剪为第二图像;并对所述第二图像进行三通道处理,得到第一通道图像、第二通道图像和第三通道图像;步骤中,将所述第一图像的四个边缘部分裁剪;将所述第一图像转换为灰色图像,并对所述灰色图像进行自适应二值化得到二值图像,根据所述二值图像求其轮廓集合点;根据所述轮廓集合点坐标和旋转角度,通过放射变换方法裁剪所述第一图像形成所述第二图像,所述第二图像为目标图像。在RGB格式下,将所述第二图像进行三通道处理,得到第一通道图像、第二通道图像和第三通道图像。4.根据权利要求3所述的方法,其特征在于,所述分别计算所述第一通道图像、第二通道图像和第三通道图像的二值化阈值,然后根据阈值调整函数计算得到0-255的数组,数组中不同的二值化阈值分别对应不同颜色值拉伸后的值;步骤中,包括:通过最大类间方差法、基特勒和伊尔林格沃斯法和最大熵法求得每个通道的三组二值化阈值,然后对三组二值化阈值加权得到所述第一通道图像或第二通道图像或第三通道图像的二值化阈值;根据预设三个数组中的值,按照预定的函数得到对应不同颜色值拉伸后的值。5.根据权利要求4所述的方法,其特征在于,所述遍历所述第一通道图像、第二通道图像和第三通道图像,分别用0-255的数组替换其颜色值;最后将替换后的所述第一通道...

【专利技术属性】
技术研发人员:张龙彬何佳文
申请(专利权)人:北京麦哲科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1