用于去除文档图像中干扰信息的方法及相关产品技术

技术编号:35771894 阅读:18 留言:0更新日期:2022-12-01 14:14
本发明专利技术的实施方式提供了一种用于去除文档图像中干扰信息的方法及相关产品。用于去除文档图像中干扰信息的方法包括获取待处理的文档图像,其中所述文档图像中包括干扰信息;通过两个不同的干扰信息去除策略分别对所述文档图像中的干扰信息进行去除处理,以得到两个初始处理图像;以及根据两个所述初始处理图像中各个像素的像素值来确定去除干扰信息的最终处理图像中各个像素的目标像素值,以实现对所述文档图像的去干扰处理。本方案由于通过两个干扰信息去除策略共同去除干扰信息,相比于单独使用一个干扰信息去除策略而言,干扰信息的去除效果更好,从而使得去除干扰后的图像更符合阅读和打印等使用需求。更符合阅读和打印等使用需求。更符合阅读和打印等使用需求。

【技术实现步骤摘要】
用于去除文档图像中干扰信息的方法及相关产品


[0001]本专利技术的实施方式涉及数据处理
,更具体地,本专利技术的实施方式涉及用于去除文档图像中干扰信息的方法、计算装置及计算机可读存储介质。

技术介绍

[0002]本部分旨在为权利要求书中陈述的本专利技术的实施方式提供背景或上下文。此处的描述可包括可以探究的概念,但不一定是之前已经想到或者已经探究的概念。因此,除非在此指出,否则在本部分中描述的内容对于本申请的说明书和权利要求书而言不是现有技术,并且并不因为包括在本部分中就承认是现有技术。
[0003]随着移动互联网的发展,手机等智能设备已经深入到大众的工作和生活,通过智能设备可以进行各种信息的处理。图像是最常见的信息载体之一,而文档又是图像最常见的内容之一,但是受光照、相机参数、拍照方式、传输压缩等各种因素的影响,文档图像中可能会存在阴影、模糊、噪点、透字等各种问题,因此亟需通过某种技术来提高文档图像的质量。另外,文档图像中除了包括印刷体信息之外,还可能包含手写的文字、标记和涂鸦等非印刷体信息,而在金融和教育等场景中,用户通常希望能去除掉图像中的非印刷体信息。例如,银行在识别报表时通常不希望识别手写签名,而学生在进行错题收集时希望能去除掉上面的手写作答痕迹等。

技术实现思路

[0004]在现有技术中,如何去除掉文档图像中的干扰信息是非常令人烦恼的过程。
[0005]因此,期望提供一种用于去除文档图像中干扰信息的方案,其能最大限度的去除文档图像中的干扰信息,从而使得去除干扰后的图像更符合阅读和打印等使用需求。
[0006]在本上下文中,本专利技术的实施方式期望提供一种用于去除文档图像中干扰信息的方法、计算装置及计算机可读存储介质。
[0007]在本专利技术实施方式的第一方面中,提供了一种用于去除文档图像中干扰信息的方法,包括:获取待处理的文档图像,其中所述文档图像中包括干扰信息;通过两个不同的干扰信息去除策略分别对所述文档图像中的干扰信息进行去除处理,以得到两个初始处理图像;以及根据两个所述初始处理图像中各个像素的像素值来确定去除干扰信息的最终处理图像中各个像素的目标像素值,以实现对所述文档图像的去干扰处理。
[0008]在本专利技术的一些实施例中,上述两个不同的干扰信息去除策略中之一包括:利用图像分割模型对所述文档图像进行图像分割,以得到所述文档图像中的干扰信息图像;根据所述干扰信息图像确定第一像素值,并用其替换所述干扰信息中各个像素的像素值,以在所述文档图像中初步去除干扰信息;以及利用图像增强模型对初步去除干扰信息后的文档图像进行图像增强处理,以得到所述初始处理图像。
[0009]在本专利技术进一步的实施例中,上述根据所述干扰信息图像确定第一像素值包括:在所述干扰信息图像中,根据位于所述干扰信息的轮廓外的预设区域内各个像素的像素值
计算所述预设区域内的像素均值,作为所述第一像素值。
[0010]在本专利技术的另一些实施例中,上述计算所述预设区域内的像素均值包括:将所述预设区域内各个像素的像素值按照由大到小的顺序依次排序;按照排序顺序依次选择预设数目的像素值;以及根据选择的预设数目的像素值计算所述预设区域内的像素均值。
[0011]在本专利技术的又一些实施例中,上述两个不同的干扰信息去除策略中之一包括:利用图像分割模型和图像增强模型分别对所述文档图像进行图像分割和图像增强处理,以得到增强后的文档图像中的干扰信息图像;以及利用预设的第二像素值对所述干扰信息图像中的各个像素的像素值进行替换,以得到所述初始处理图像。
[0012]可选地或附加地,在一些实施例中,所述图像增强处理至少包括去色处理、去噪处理和对比度增强处理中的一种或至少两种的组合。
[0013]在本专利技术的再一些实施例中,上述根据两个所述初始处理图像中各个像素的像素值来确定所述最终处理图像中各个像素的目标像素值包括:将两个所述初始处理图像中各个对应像素的最大像素值作为所述最终处理图像中各个像素的目标像素值。
[0014]在本专利技术进一步的实施例中,上述用于去除文档图像中干扰信息的方法还包括:对所述最终处理图像执行下述操作中的至少一种或任意两种的组合:旋转;偏移;以及缩放。
[0015]在本专利技术的一些实施例中,上述用于训练所述图像分割模型的输入图像样本和标签图像至少通过下述方法获取:获取采集的具有干扰信息的文档图像,将其作为用于训练所述图像分割模型的输入图像样本;去除所述文档图像中的干扰信息;以及将所述具有干扰信息的文档图像和去除干扰信息后的文档图像进行作差处理,以得到用于训练所述图像分割模型的标签图像。
[0016]在本专利技术进一步的实施例中,上述用于训练所述图像分割模型的输入图像样本和标签图像还通过下述方法获取:获取干扰信息和对应的背景图;将所述干扰信息渲染到所述背景图中,以得到用于训练所述图像分割模型的输入图像样本;以及将所述干扰信息渲染到与所述背景图的大小相对应的白底图上,以得到用于训练所述图像分割模型的标签图像。
[0017]可选地或附加地,在一些实施例中,上述用于训练所述图像分割模型的输入图像样本和标签图像还通过下述方法获取:获取干扰信息图像和不具有干扰信息的文档图像;将所述干扰信息图像叠加到所述不具有干扰信息的文档图像中,以得到用于训练所述图像分割模型的输入图像样本;以及将所述干扰信息图像叠加到与所述不具有干扰信息的文档图像大小相对应的白底图上,以得到用于训练所述图像分割模型的标签图像。
[0018]在本专利技术的另一些实施例中,上述用于训练所述图像增强模型的输入图像样本和标签图像通过下述方法获取:获取文档图像,将其作为用于训练所述图像增强模型的标签图像;以及对所述文档图像进行降阶处理,以得到用于训练所述图像增强模型的输入图像样本,其中所述降阶处理包括在所述文档图像中执行增加噪声、增色和降低对比度中的一种或至少两种组合操作。
[0019]在本专利技术实施方式的第二方面中,提供了一种计算装置,包括:处理器,其配置用于执行程序指令;以及存储器,其配置用于存储所述程序指令,当所述程序指令由所述处理器加载并执行时,使得所述处理器执行根据本专利技术实施方式的第一方面任一实施例所述的
方法。
[0020]在本专利技术实施方式的第三方面中,提供了一种计算机可读存储介质,其中存储有程序指令,当所述程序指令由处理器加载并执行时,使得所述处理器执行根据本专利技术实施方式的第一方面任一实施例所述的方法。
[0021]根据本专利技术实施方式的用于去除文档图像中干扰信息的方案可以通过两个干扰信息去除策略共同去除文档图像中的干扰信息,相比于单独使用一个干扰信息去除策略而言,干扰信息的去除效果更好,从而使得去除干扰信息后的图像更符合阅读和打印等使用需求。
附图说明
[0022]通过参考附图阅读下文的详细描述,本专利技术示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本专利技术的若干实施方式,其中:
[0023]图1示意性地示出了本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于去除文档图像中干扰信息的方法,其特征在于,包括:获取待处理的文档图像,其中所述文档图像中包括干扰信息;通过两个不同的干扰信息去除策略分别对所述文档图像中的干扰信息进行去除处理,以得到两个初始处理图像;以及根据两个所述初始处理图像中各个像素的像素值来确定去除干扰信息的最终处理图像中各个像素的目标像素值,以实现对所述文档图像的去干扰处理。2.根据权利要求1所述的方法,其特征在于,其中两个不同的干扰信息去除策略中之一包括:利用图像分割模型对所述文档图像进行图像分割,以得到所述文档图像中的干扰信息图像;根据所述干扰信息图像确定第一像素值,并用其替换所述干扰信息中各个像素的像素值,以在所述文档图像中初步去除干扰信息;以及利用图像增强模型对初步去除干扰信息后的文档图像进行图像增强处理,以得到所述初始处理图像;优选地,根据所述干扰信息图像确定第一像素值包括:在所述干扰信息图像中,根据位于所述干扰信息的轮廓外的预设区域内各个像素的像素值计算所述预设区域内的像素均值,作为所述第一像素值;优选地,其中计算所述预设区域内的像素均值包括:将所述预设区域内各个像素的像素值按照由大到小的顺序依次排序;按照排序顺序依次选择预设数目的像素值;以及根据选择的预设数目的像素值计算所述预设区域内的像素均值。3.根据权利要求1或2所述的方法,其特征在于,其中两个不同的干扰信息去除策略中之一包括:利用图像分割模型和图像增强模型分别对所述文档图像进行图像分割和图像增强处理,以得到增强后的文档图像中的干扰信息图像;以及利用预设的第二像素值对所述干扰信息图像中的各个像素的像素值进行替换,以得到所述初始处理图像;优选地,其中所述图像增强处理至少包括去色处理、去噪处理和对比度增强处理中的一种或至少两种的组合。4.根据权利要求1

3任一所述的方法,其特征在于,其中根据两个所述初始处理图像中各个像素的像素值来确定所述最终处理图像中各个像素的目标像素值包括:将两个所述初始处理图像中各个对应像素的最大像素值作为所述最终处理图像中各个像素的目标像素值。5.根据权利要求1

4任一所述的方法,其特征在于,还包括:对所述最终处理图像执行下述操作中的至...

【专利技术属性】
技术研发人员:董士琪李翌昕沈磊林辉段亦涛
申请(专利权)人:网易有道信息技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1