一种文档图像视觉效果的优化方法及系统技术方案

技术编号:20118924 阅读:25 留言:0更新日期:2019-01-16 12:16
本发明专利技术涉及一种文档图像视觉效果的优化方法及系统,方法包括:对输入的文档图像进行识别判断,检测出图像中的文本区域、图形图像区域和背景区域;对所述文本区域进行处理,判断出文本区域中的底色区域和文本笔画区域;进行背景处理,合成背景图像;所述进行背景处理包括对底色区域和背景区域进行处理;对所述图形图像区域和文本笔画区域进行灰度级拉伸,再将处理后的图像叠加到所述背景图像上。本发明专利技术能够从原始图像中区分出前景和背景,并通过对背景和前景进行处理,实现文档图像视觉效果的优化,从而提升后续的诸如光学文字识别(OCR)等图像处理的效果。

An Optimized Method and System for Visual Effects of Document Images

The present invention relates to an optimization method and system for the visual effect of document image, which includes: recognizing and judging the input document image, detecting the text area, graphic image area and background area in the image; processing the text area to determine the background color area and text stroke area in the text area; background processing to synthesize the background image; The background processing includes processing the background color area and the background area, stretching the gray level of the graphic image area and the text strokes area, and then superimposing the processed image on the background image. The invention can distinguish foreground and background from original image, and optimize the visual effect of document image by processing background and foreground, thereby improving the effect of subsequent image processing such as optical character recognition (OCR).

【技术实现步骤摘要】
一种文档图像视觉效果的优化方法及系统
本专利技术涉及图像设备和图像处理
,特别是涉及一种高清拍摄仪设备,更确切的说,本专利技术涉及用于提高高清拍摄仪拍摄图像视觉效果的优化方法及系统。
技术介绍
由于高清拍摄仪是一种开放环境的图像采集设备,因此无法保证图像获取环境的稳定性。图像设备获取的原始图像,由于光照条件的不确定性,以及光学元器件存在的不一致性,原始图像极大可能存在阴影。图像如果存在阴影,对于后续基于图像的各种处理,都将产生不利影响,例如:导致人眼感观效果变差;可能导致基于OCR(光学文字识别)的图像信息提取准确度大幅度降低;可能导致基于图像匹配技术的票据验真、印章验真以及类似的技术环节,错判的概率大幅度增大;可能导致需要打印图像的场合,打印出来的图像发黑。目前,常见的减弱高清拍摄仪设备处理“阴影”的方法有如下两种:其一,提高高清拍摄仪摄像头硬件设备的对比度参数,使图像背景的整体RGB值更趋向白色,从而在视觉上造成一种减轻“阴影”的效果;其二,高清拍摄仪设备获取图像之后,通过算法拉伸图像的灰度值,从而提高原始图像中背景区域的灰度级。上述两种方法,最终的出图效果并不能完全去除“阴影”,而且可能会影响图像中的“有效信息”。本专利技术区别于以上的现有技术,并较传统算法在特征分析精度、图像重构效率方面有较大提高。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提出一种文档图像视觉效果的优化方法及系统,能够从原始图像中区分出前景“有效信息”部分和底色“阴影”部分,并通过对底色和前景进行处理,实现文档图像视觉效果的优化。本专利技术解决其技术问题所采用的技术方案是:一方面,本专利技术一种文档图像视觉效果的优化方法,包括:对输入的文档图像进行识别判断,检测出图像中的文本区域、图形图像区域和背景区域;对所述文本区域进行处理,判断出文本区域中的底色区域和文本笔画区域;进行背景处理,合成背景图像;所述进行背景处理包括对底色区域和背景区域进行处理;对所述图形图像区域和文本笔画区域进行灰度级拉伸,再将处理后的图像叠加到所述背景图像上。优选的,所述对输入的文档图像进行识别判断,检测出图像中的文本区域、图形图像区域和背景区域,具体包括:对所述文档图像进行局部阈值二值化处理,基于二值图像判断出所述文档图像中的前景区域和背景区域;基于训练好的分类器对所述前景区域进行识别判断,检测出所述前景区域中的文本区域和图形图像区域。优选的,对所述文档图像进行局部阈值二值化处理,基于二值图像判断出所述文档图像中的前景区域和背景区域,具体包括:对所述文档图像中的每个像素点进行处理,得到二值图像;其中,二值图像中像素值为1的点属于前景区域,二值图像中像素值为0的点属于背景区域。优选的,所述基于训练好的分类器对所述前景区域进行识别判断,检测出所述前景区域中的文本区域和图形图像区域,具体包括:构建多层卷积神经网络作为分类器,并利用有标记的样本数据训练分类器;将预设大小的窗口滑过前景区域,利用训练好的分类器对窗口内图像的类别进行判断,滑动窗口直到获得前景区域中每个像素点的判断结果,检测出所述前景区域中的文本区域和图形图像区域。优选的,所述对输入的文档图像进行识别判断,检测出图像中的文本区域、图形图像区域和背景区域,具体包括:构建多层卷积神经网络作为分类器,并利用有标记的样本数据训练分类器;将预设大小的窗口滑过文档图像,利用训练好的分类器对窗口内图像区域的类别进行判断,继续滑动窗口直到获得整幅文档图像每个像素点的判断结果;所述类别包括文本区域、图形图像区域和背景区域。优选的,对所述文本区域进行处理,判断出文本区域中的底色区域和文本笔画区域,具体包括:对所述文本区域中的每个像素点进行处理,得到二值图像;其中,二值图像中像素值为1的点属于文本笔画区域,二值图像中像素值为0的点属于底色区域。优选的,所述进行背景处理,合成背景图像,具体包括:利用纯色作为背景图像,或者,提取背景纹理,调整背景灰度级作为背景图像。优选的,所述提取背景纹理,调整背景灰度级作为背景图像,包括:将文档图像转到HSV颜色空间;提取图像V通道的亮度值,得到亮度图像G;对G进行指定窗口大小的中值滤波,得到背景平均灰度级图像J;亮度调整,将G中每个像素的灰度级减去J中对应像素的灰度级,再与一个参考的灰度级b求和,得到背景亮度图像K;将文档图像V通道的亮度图像替换成K,将图像从HSV空间转到RGB颜色空间。优选的,对所述图形图像区域和文本笔画区域进行灰度级拉伸,再将处理后的图像叠加到所述背景图像上,具体包括:估计所述图形图像区域的灰度级,根据背景灰度级进行灰度级拉伸,将处理后的图像叠加到背景图像上;截取所述文本笔画区域在原图中的像素值,并叠加到背景图像上,或者,估计所述文本笔画区域的灰度级,根据背景灰度级进行灰度级拉伸,将处理后的图像叠加到背景图像上。另一方面,本专利技术一种文档图像视觉效果的优化系统,包括:类别判断模块,用于对输入的文档图像进行识别判断,检测出图像中的文本区域、图形图像区域和背景区域;文本区域类别判断模块,用于对所述文本区域进行处理,判断出文本区域中的底色区域和文本笔画区域;背景图像合成模块,用于进行背景处理,合成背景图像;所述进行背景处理包括对底色区域和背景区域进行处理;前景目标处理模块,用于对所述图形图像区域和文本笔画区域进行灰度级拉伸,再将处理后的图像叠加到所述背景图像上。与现有技术相比,本专利技术具有如下有益效果:本专利技术能够利用多层卷积神经网络作为分类器从原始图像中识别“文本区域”,“图形图像区域”和“背景区域”,然后进行相应的图像重构,实现文档图像视觉效果的优化,从而提升后续的诸如光学文字识别(OCR)等图像处理的效果。以下结合附图及实施例对本专利技术作进一步详细说明,但本专利技术的一种文档图像视觉效果的优化方法及系统不局限于实施例。附图说明图1是本专利技术一种文档图像视觉效果的优化方法的处理流程图;图2是高清拍摄仪采集的文档图像;图3是本专利技术的将纯色作为背景对图2的文档图像进行处理得到的输出图像;图4是本专利技术的调整背景灰度级作为背景对图2的文档图像进行处理得到的输出图像。具体实施方式下面结合附图详细描述本专利技术的实施例,需要注意的是附图所描述的实施例仅仅是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。以下结合附图描述根据本专利技术实施例的文档图像视觉效果的优化方法及系统。实施例1参见图1所示,一方面,本专利技术一种文档图像视觉效果的优化方法,包括如下步骤:步骤101,对输入的文档图像进行识别判断,检测出图像中的文本区域、图形图像区域和背景区域;具体的,包括如下步骤:步骤1011,利用文本区域和图形图像区域局部灰度级变化较大,存在较多的边缘,而背景区域局部的灰度级变化较小的特性,对文档图像进行局部阈值二值化处理,基于二值图像判断图像中的前景区域(文本区域和图形图像区域)和背景区域。具体的,将文档图像中一个像素点的自适应阈值定义为以该像素为中心、半径为r的圆形区域内像素的平均值再减去一个常量g;如果该像素点的值小于该阈值,则将该像素点的值置1,否则该像素点的值置0;对文档图像中的每个像素点进行处理,得到二值图像,二值图像中像素值为1的点属于前景区域,二值图像中像素值为0的点属于背景区域。步骤10本文档来自技高网...

【技术保护点】
1.一种文档图像视觉效果的优化方法,其特征在于,包括:对输入的文档图像进行识别判断,检测出图像中的文本区域、图形图像区域和背景区域;对所述文本区域进行处理,判断出文本区域中的底色区域和文本笔画区域;进行背景处理,合成背景图像;所述进行背景处理包括对底色区域和背景区域进行处理;对所述图形图像区域和文本笔画区域进行灰度级拉伸,再将处理后的图像叠加到所述背景图像上。

【技术特征摘要】
1.一种文档图像视觉效果的优化方法,其特征在于,包括:对输入的文档图像进行识别判断,检测出图像中的文本区域、图形图像区域和背景区域;对所述文本区域进行处理,判断出文本区域中的底色区域和文本笔画区域;进行背景处理,合成背景图像;所述进行背景处理包括对底色区域和背景区域进行处理;对所述图形图像区域和文本笔画区域进行灰度级拉伸,再将处理后的图像叠加到所述背景图像上。2.根据权利要求1所述的文档图像视觉效果的优化方法,其特征在于,所述对输入的文档图像进行识别判断,检测出图像中的文本区域、图形图像区域和背景区域,具体包括:对所述文档图像进行局部阈值二值化处理,基于二值图像判断出所述文档图像中的前景区域和背景区域;基于训练好的分类器对所述前景区域进行识别判断,检测出所述前景区域中的文本区域和图形图像区域。3.根据权利要求2所述的文档图像视觉效果的优化方法,其特征在于,对所述文档图像进行局部阈值二值化处理,基于二值图像判断出所述文档图像中的前景区域和背景区域,具体包括:对所述文档图像中的每个像素点进行处理,得到二值图像;其中,二值图像中像素值为1的点属于前景区域,二值图像中像素值为0的点属于背景区域。4.根据权利要求2所述的文档图像视觉效果的优化方法,其特征在于,所述基于训练好的分类器对所述前景区域进行识别判断,检测出所述前景区域中的文本区域和图形图像区域,具体包括:构建多层卷积神经网络作为分类器,并利用有标记的样本数据训练分类器;将预设大小的窗口滑过前景区域,利用训练好的分类器对窗口内图像的类别进行判断,滑动窗口直到获得前景区域中每个像素点的判断结果,检测出所述前景区域中的文本区域和图形图像区域。5.根据权利要求1所述的文档图像视觉效果的优化方法,其特征在于,所述对输入的文档图像进行识别判断,检测出图像中的文本区域、图形图像区域和背景区域,具体包括:构建多层卷积神经网络作为分类器,并利用有标记的样本数据训练分类器;将预设大小的窗口滑过文档图像,利用训练好的分类器对窗口内图像区域的类别进行判断,继续滑动窗口直到获得整幅文档图像每个像素点的判断结果;所述类别包...

【专利技术属性】
技术研发人员:刘嘉张旗川
申请(专利权)人:厦门哲林软件科技有限公司
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1