The present invention relates to an optimization method and system for the visual effect of document image, which includes: recognizing and judging the input document image, detecting the text area, graphic image area and background area in the image; processing the text area to determine the background color area and text stroke area in the text area; background processing to synthesize the background image; The background processing includes processing the background color area and the background area, stretching the gray level of the graphic image area and the text strokes area, and then superimposing the processed image on the background image. The invention can distinguish foreground and background from original image, and optimize the visual effect of document image by processing background and foreground, thereby improving the effect of subsequent image processing such as optical character recognition (OCR).
【技术实现步骤摘要】
一种文档图像视觉效果的优化方法及系统
本专利技术涉及图像设备和图像处理
,特别是涉及一种高清拍摄仪设备,更确切的说,本专利技术涉及用于提高高清拍摄仪拍摄图像视觉效果的优化方法及系统。
技术介绍
由于高清拍摄仪是一种开放环境的图像采集设备,因此无法保证图像获取环境的稳定性。图像设备获取的原始图像,由于光照条件的不确定性,以及光学元器件存在的不一致性,原始图像极大可能存在阴影。图像如果存在阴影,对于后续基于图像的各种处理,都将产生不利影响,例如:导致人眼感观效果变差;可能导致基于OCR(光学文字识别)的图像信息提取准确度大幅度降低;可能导致基于图像匹配技术的票据验真、印章验真以及类似的技术环节,错判的概率大幅度增大;可能导致需要打印图像的场合,打印出来的图像发黑。目前,常见的减弱高清拍摄仪设备处理“阴影”的方法有如下两种:其一,提高高清拍摄仪摄像头硬件设备的对比度参数,使图像背景的整体RGB值更趋向白色,从而在视觉上造成一种减轻“阴影”的效果;其二,高清拍摄仪设备获取图像之后,通过算法拉伸图像的灰度值,从而提高原始图像中背景区域的灰度级。上述两种方法,最终的出图效果并不能完全去除“阴影”,而且可能会影响图像中的“有效信息”。本专利技术区别于以上的现有技术,并较传统算法在特征分析精度、图像重构效率方面有较大提高。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提出一种文档图像视觉效果的优化方法及系统,能够从原始图像中区分出前景“有效信息”部分和底色“阴影”部分,并通过对底色和前景进行处理,实现文档图像视觉效果的优化。本专利技术解决其技术问题所采用的技术 ...
【技术保护点】
1.一种文档图像视觉效果的优化方法,其特征在于,包括:对输入的文档图像进行识别判断,检测出图像中的文本区域、图形图像区域和背景区域;对所述文本区域进行处理,判断出文本区域中的底色区域和文本笔画区域;进行背景处理,合成背景图像;所述进行背景处理包括对底色区域和背景区域进行处理;对所述图形图像区域和文本笔画区域进行灰度级拉伸,再将处理后的图像叠加到所述背景图像上。
【技术特征摘要】
1.一种文档图像视觉效果的优化方法,其特征在于,包括:对输入的文档图像进行识别判断,检测出图像中的文本区域、图形图像区域和背景区域;对所述文本区域进行处理,判断出文本区域中的底色区域和文本笔画区域;进行背景处理,合成背景图像;所述进行背景处理包括对底色区域和背景区域进行处理;对所述图形图像区域和文本笔画区域进行灰度级拉伸,再将处理后的图像叠加到所述背景图像上。2.根据权利要求1所述的文档图像视觉效果的优化方法,其特征在于,所述对输入的文档图像进行识别判断,检测出图像中的文本区域、图形图像区域和背景区域,具体包括:对所述文档图像进行局部阈值二值化处理,基于二值图像判断出所述文档图像中的前景区域和背景区域;基于训练好的分类器对所述前景区域进行识别判断,检测出所述前景区域中的文本区域和图形图像区域。3.根据权利要求2所述的文档图像视觉效果的优化方法,其特征在于,对所述文档图像进行局部阈值二值化处理,基于二值图像判断出所述文档图像中的前景区域和背景区域,具体包括:对所述文档图像中的每个像素点进行处理,得到二值图像;其中,二值图像中像素值为1的点属于前景区域,二值图像中像素值为0的点属于背景区域。4.根据权利要求2所述的文档图像视觉效果的优化方法,其特征在于,所述基于训练好的分类器对所述前景区域进行识别判断,检测出所述前景区域中的文本区域和图形图像区域,具体包括:构建多层卷积神经网络作为分类器,并利用有标记的样本数据训练分类器;将预设大小的窗口滑过前景区域,利用训练好的分类器对窗口内图像的类别进行判断,滑动窗口直到获得前景区域中每个像素点的判断结果,检测出所述前景区域中的文本区域和图形图像区域。5.根据权利要求1所述的文档图像视觉效果的优化方法,其特征在于,所述对输入的文档图像进行识别判断,检测出图像中的文本区域、图形图像区域和背景区域,具体包括:构建多层卷积神经网络作为分类器,并利用有标记的样本数据训练分类器;将预设大小的窗口滑过文档图像,利用训练好的分类器对窗口内图像区域的类别进行判断,继续滑动窗口直到获得整幅文档图像每个像素点的判断结果;所述类别包...
【专利技术属性】
技术研发人员:刘嘉,张旗川,
申请(专利权)人:厦门哲林软件科技有限公司,
类型:发明
国别省市:福建,35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。