文本图像背面渗透的移除方法技术

技术编号:14848808 阅读:133 留言:0更新日期:2017-03-17 22:17
本发明专利技术提供一种文本图像背面渗透的移除方法,从两张对齐的正反面图像中得到相除图像,对相除图像的直方图通过预设定的第一阈值和第二阈值得到正面笔画的第一模板图和背面笔画的第一模板图;从正面图像的直方图中利用二值化算法得到正面笔画的第二模板图,从对齐的背面图像的直方图中利用二值化算法得到背面笔画的第二模板图。根据正面笔画的第一模板图和第二模板图以及背面笔画的第一模板图和第二模板图得到共同前景像素,共同背景像素,正面背透像素,反面背透像素四类像素,采用随机填充算法修复背面渗透部分。该方法能有效的去除文本扫描图像中的背面渗透部分,较好的保证文本前景部分的完整性,提高文本图像的可读性。

【技术实现步骤摘要】

本专利技术涉及一种文本图像背面渗透的移除方法
技术介绍
由于古籍文本稀少珍贵,现代的保护方法往往是把这些古籍数字化,以扫描图像的方式供研究人员翻阅。由于古籍纸张质量或者长时间保存的问题,许多双面书写或印刷的古籍都发生了背面渗透的现象,即墨水从纸张的另一面渗出的另一面的现象。这种现象会使古籍文本的内容难以阅读,同时,也影响了某些珍贵手稿的视觉美感。为了解决这个问题,现已提出很多背面渗透移除的方法。这些方法基于图像中像素点的信息把像素归类为前景,背透和背景三类。但是仅仅利用一面的信息无法完全区分背透和正面浅色文字,而且这类方法计算速度很慢,所以无法达到实用的要求。
技术实现思路
本专利技术的目的是提供一种文本图像背面渗透的移除方法解决现有技术中存在的仅利用一面的信息无法完全区分背透和正面浅色文字的问题。本专利技术的技术解决方案是:一种文本图像背面渗透的移除方法,包括以下步骤:步骤1、从两张对齐的正面图像与反面图像中得到相除图像,并对所得相除图像求灰度直方图;步骤2、对所得相除图像的直方图通过预设定的第一阈值和第二阈值得到正面笔画的第一模板图和背面笔画的第一模板图;步骤3、对正面图像求灰度直方图,从正面图像的直方图中利用二值化算法得到正面笔画的第二模板图;步骤4、对反面图像求灰度直方图,从对齐的背面图像的直方图中利用二值化算法得到背面笔画的第二模板图;步骤5、根据正面笔画的第一模板图和正面笔画的第二模板图以及背面笔画的第一模板图和背面笔画的第二模板图得到共同前景像素种子、共同背景像素种子、正面背透像素种子、反面背透像素四类像素种子;步骤6、对步骤5所得共同前景像素种子、共同背景像素种子、正面背透像素种子、反面背透像素四类种子像素图像,求每一类像素点灰度值的均值和方差进行聚类,然后对正面图像和反面图像中其余没有被归类到这四类的像素点进行分类,最后组合为正面前景图像和反面前景图像;步骤7、最后分别对正面前景图像和反面前景图像采用随机填充算法修复背面渗透部分,得到正面无背透图像、反面无背透图像。进一步地,从正面图像和反面图像得到相除图像的公式为:相除图像的像素灰度值=正面图像的像素灰度值/反面图像的像素灰度值。进一步地,步骤2中,对所得相除图像的直方图,通过预先设定的第一阈值,得到所有像素值小于第一阈值的点,组成正面图像的第一模板图;通过预先设定的第二阈值,得到所有像素值大于第二阈值的点,组成反面图像的第一模板图。进一步地,步骤3和步骤4中,利用的二值化算法均为基于整体的Otsu二值化方法。进一步地,步骤5中,对正面笔画的第一模板图和正面笔画的第二模板图以及背面笔画的第一模板图和背面笔画的第二模板图,求出满足以下要求的点,作为共同前景像素种子:正面第一模板图像素值为255,反面第一模板图像素值为255;求出满足以下要求的点,作为共同背景像素种子:正面第二模板图像素值为0,反面第二模板图像素值为0;求出满足以下要求的点,作为正面背透像素种子:正面第二模板图像素值为0,反面第一模板图像素值为255;求出满足以下要求的点,作为背面背透像素种子:正面第一模板图像素值为255,反面第二模板图像素值为0。进一步地,步骤6中,对正面图像和反面图像中其余没有被归类到这四类的像素点进行分类,具体为:把每一个像素点根据离四类中任意一类像素点灰度值的均值中心的距离远近分到距该像素点的距离最小的一类,得到四个图像:正面前景/反面背透、正面前景/反面前景、反面前景/正面背透、正面背景/反面背景;把正面前景/反面背透和正面前景/反面前景组合为正面前景图;把正面前景/反面前景和反面前景/正面背透组合为反面前景图。本专利技术的有益效果是:该种文本图像背面渗透的移除方法,能有效的去除文本扫描图像中的背面渗透部分同时较好的保证文本前景部分的完整性,提高文本图像的可读性,因此可用于解决古籍扫描图像的数字化修复问题。附图说明图1是本专利技术实施例文本图像背面渗透的移除方法的流程说明示意图。图2为实施例中正面图像的示意图。图3为实施例中反面图像的示意图。图4为图2与图3所得相除图像的示意图。图5为图2与图3所得相除图像对应的直方图的示意图。图6为实施例中正面笔画的第一模板图的示意图。图7为实施例中反面笔画的第一模板图的示意图。图8为实施例中正面图像的灰度直方图的的示意图。图9为实施例中正面图像的第二模板图的示意图。图10为实施例中反面图像的直方图的示意图。图11为实施例中反面图像的第二模板图的示意图。具体实施方式下面结合附图详细说明本专利技术的优选实施例。实施例一种文本图像背面渗透的移除方法,包括以下步骤,如图1:步骤1、从两张对齐的正面图像与反面图像中得到相除图像,如图2、图3、图4,并对所得相除图像求灰度直方图,如图5;从正面图像和反面图像得到相除图像的公式为:相除图像的像素灰度值=正面图像的像素灰度值/反面图像的像素灰度值。步骤2、对所得相除图像的直方图通过预设定的第一阈值和第二阈值得到正面笔画的第一模板图和背面笔画的第一模板图,如图6和图7;对所得相除图像的直方图,通过预先设定的第一阈值,得到所有像素值小于第一阈值的点,组成正面图像的第一模板图,如图6;通过预先设定的第二阈值,得到所有像素值大于第二阈值的点,组成反面图像的第一模板图,如图7。步骤3、对正面图像求灰度直方图,如图8,从正面图像的直方图中利用二值化算法得到正面笔画的第二模板图,如图9;二值化算法采用基于整体的Otsu二值化方法。步骤4、对反面图像求灰度直方图,如图10,从对齐的背面图像的直方图中利用二值化算法得到背面笔画的第二模板图,如图11;二值化算法采用基于整体的Otsu二值化方法。步骤5、根据正面笔画的第一模板图和正面笔画的第二模板图以及背面笔画的第一模板图和背面笔画的第二模板图得到共同前景像素种子、共同背景像素种子、正面背透像素种子、反面背透像素四类像素种子;对正面笔画的第一模板图和正面笔画的第二模板图以及背面笔画的第一模板图和背面笔画的第二模板图,求出满足以下要求的点,作为共同前景像素种子:正面第一模板图像素值为255,反面第一模板图像素值为255。对正面笔画的第一模板图和正面笔画的第二模板图以及背面笔画的第一模板图和背面笔画的第二模板图,求出满足以下要求的点,作为共同背景像素种子:...

【技术保护点】
一种文本图像背面渗透的移除方法,其特征在于:包括以下步骤:步骤1、从两张对齐的正面图像与反面图像中得到相除图像,并对所得相除图像求灰度直方图;步骤2、对所得相除图像的直方图通过预设定的第一阈值和第二阈值得到正面笔画的第一模板图和背面笔画的第一模板图;步骤3、对正面图像求灰度直方图,从正面图像的直方图中利用二值化算法得到正面笔画的第二模板图;步骤4、对反面图像求灰度直方图,从对齐的背面图像的直方图中利用二值化算法得到背面笔画的第二模板图;步骤5、根据正面笔画的第一模板图和正面笔画的第二模板图以及背面笔画的第一模板图和背面笔画的第二模板图得到共同前景像素种子、共同背景像素种子、正面背透像素种子、反面背透像素四类像素种子;步骤6、对步骤5所得共同前景像素种子、共同背景像素种子、正面背透像素种子、反面背透像素四类种子像素图像,求每一类像素点灰度值的均值和方差进行聚类,然后对正面图像和反面图像中其余没有被归类到这四类的像素点进行分类,最后组合为正面前景图像和反面前景图像;步骤7、最后分别对正面前景图像和反面前景图像采用随机填充算法修复背面渗透部分,得到正面无背透图像、反面无背透图像。

【技术特征摘要】
1.一种文本图像背面渗透的移除方法,其特征在于:包括以下步骤:
步骤1、从两张对齐的正面图像与反面图像中得到相除图像,并对所得相
除图像求灰度直方图;
步骤2、对所得相除图像的直方图通过预设定的第一阈值和第二阈值得到
正面笔画的第一模板图和背面笔画的第一模板图;
步骤3、对正面图像求灰度直方图,从正面图像的直方图中利用二值化算
法得到正面笔画的第二模板图;
步骤4、对反面图像求灰度直方图,从对齐的背面图像的直方图中利用二
值化算法得到背面笔画的第二模板图;
步骤5、根据正面笔画的第一模板图和正面笔画的第二模板图以及背面笔
画的第一模板图和背面笔画的第二模板图得到共同前景像素种子、共同背景像素
种子、正面背透像素种子、反面背透像素四类像素种子;
步骤6、对步骤5所得共同前景像素种子、共同背景像素种子、正面背透
像素种子、反面背透像素四类种子像素图像,求每一类像素点灰度值的均值和方
差进行聚类,然后对正面图像和反面图像中其余没有被归类到这四类的像素点进
行分类,最后组合为正面前景图像和反面前景图像;
步骤7、最后分别对正面前景图像和反面前景图像采用随机填充算法修复
背面渗透部分,得到正面无背透图像、反面无背透图像。
2.如权利要求1所述的文本图像背面渗透的移除方法,其特征在于:从正
面图像和反面图像得到相除图像的公式为:
相除图像的像素灰度值=正面图像的像素灰度值/反面图像的像素灰度值。
3.如权利要求1所述的文本图像背面渗透的移除方法,其特征在于:步骤
2中,对所得相除图像的直方图,通过预先设定的第一阈值,得到所有像素值小

【专利技术属性】
技术研发人员:朱利民
申请(专利权)人:江苏思曼特信用管理有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1