图像处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:22689421 阅读:19 留言:0更新日期:2019-11-30 03:51
本申请公开了一种图像处理方法、装置、电子设备及存储介质,该图像处理方法包括:获取第一文档图像;将所述第一文档图像输入至已训练的图像生成模型,所述图像生成模型由生成式对抗网络训练得到,所述图像生成模型用于根据输入的文档图像,输出具有唯一指定页面风格的文档图像;获得所述图像生成模型基于所述第一文档图像输出的第二文档图像,所述第二文档图像具有所述指定页面风格。本方法利用基于生成式对抗网络训练的文档图像的图像生成模型,完成文档图像到的指定页面风格的转换,从而得到清晰的文档图像。

Image processing method, device, electronic equipment and storage medium

The application discloses an image processing method, device, electronic device and storage medium, the image processing method includes: obtaining the first document image; inputting the first document image to the trained image generation model, the image generation model is obtained by the generated countermeasure network training, and the image generation model is used for outputting the unique image according to the input document image A document image with a specified page style; obtaining a second document image output by the image generation model based on the first document image, the second document image having the specified page style. This method uses the image generation model of the document image based on the generative anti network training to complete the conversion of the document image to the specified page style, so as to get a clear document image.

【技术实现步骤摘要】
图像处理方法、装置、电子设备及存储介质
本申请涉及图像处理
,更具体地,涉及一种图像处理方法、装置、电子设备及存储介质。
技术介绍
在数字信息化时代,很多纸质书籍会进行数字化的加工,以将书籍内容进行长期保存。其中,纸质书籍图像的数字化加工通常是采集纸质书籍的图像进行保存,但采集的图像中可能存在污渍、清晰度差等问题,导致用户在阅读保存的书籍图像体验较差。
技术实现思路
鉴于上述问题,本申请提出了一种图像处理方法、装置、电子设备及存储介质,以改善上述问题。第一方面,本申请实施例提供了一种图像处理方法,所述方法包括:获取第一文档图像;将所述第一文档图像输入至已训练的图像生成模型,所述图像生成模型由生成式对抗网络训练得到,所述图像生成模型用于根据输入的文档图像,输出具有唯一指定页面风格的文档图像;获得所述图像生成模型基于所述第一文档图像输出的第二文档图像,所述第二文档图像具有所述指定页面风格。第二方面,本申请实施例提供了一种图像处理装置,所述装置包括:图像获取模块、图像输入模块以及图像输出模块,其中,所述图像获取模块用于获取第一文档图像;所述图像输入模块用于将所述第一文档图像输入至已训练的图像生成模型,所述图像生成模型由生成式对抗网络训练得到,所述图像生成模型用于根据输入的文档图像,输出具有唯一指定页面风格的文档图像;所述图像输出模块用于获得所述图像生成模型基于所述第一文档图像输出的第二文档图像,所述第二文档图像具有所述指定页面风格。第三方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储器;一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行上述第一方面提供的图像处理方法。第四方面,本申请实施例提供了一种计算机可读取存储介质,所述计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行上述第一方面提供的图像处理方法。本申请提供的方案,通过获取待处理的第一文档图像,将第一文档图像输入至已训练的图像生成模型,该图像生成模型由生成式对抗网络训练得到,图像生成模型用于根据输入的文档图像,输出具有唯一指定页面风格的文档图像,可以获得图像生成模型基于第一文档图像输出的第二文档图像,并且第二文档图像具有该指定页面风格,从而可以实现将文档图像处理为指定页面风格,去除文档图像中的污渍,获得字迹清晰的文档图像。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示出了根据本申请一个实施例的图像处理方法流程图。图2a及图2b示出了本申请实施例提供的文档图像通过图像生成模型生成目标页面风格的文档图像的一种对比图。图3示出了根据本申请另一个实施例的图像处理方法流程图。图4示出了本申请另一个实施例提供的对抗式生成网络的训练过程的示意图。图5示出了根据本申请另一实施例提供的重建损失的示意图。图6示出了根据本申请一个实施例的图像处理装置的一种框图。图7示出了根据本申请一个实施例的图像处理装置的另一种框图。图8是本申请实施例的用于执行根据本申请实施例的图像处理方法的电子设备的框图。图9是本申请实施例的用于保存或者携带实现根据本申请实施例的图像处理方法的程序代码的存储单元。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。古籍是中国的宝贵财富和民族文化发展的缩影,古籍文化也是中华民族思想传承的载体,但是古籍的纸张不宜于保存,因此在信息数字化的时代,将古籍进行数字化加工是古籍长期保存的发展趋势。其中,对古籍进行数字化加工,通常是通过获取古籍文档内容的图像,然后进行图像处理后进行保存。影印的古籍文档图像通常会存在页面泛黄、泛黑、墨迹浸润、页面污渍等现象。因此,会对古籍文档图像进行二值化处理、古籍文档的边框检测、污点检测等,以获取修复后的可用于保存的古籍文档图像。专利技术人经过长时间的研究发现,传统的对文档图像的处理方法,通常采用的是工作人员手工设计的处理流程,以及手工的特征工程对文档图像进行处理,但是各种阈值计算的公式相对复杂,并且二值化算法、阈值和领域窗口半径的选取影响着图像处理的效果,因此对工作人员的要求较高。另外,传统的文档图像处理方案仅能针对有限的污染类型的处理,泛化性不强,不能覆盖到多种情况。针对上述问题,专利技术人提出了本申请实施例提供的图像处理方法、装置、电子设备以及存储介质,可以实现通过能根据输入的文档图像,输出具有指定页面风格的文档图像的图像生成模型,对文档图像进行处理而生成指定页面风格的文档图像,实现无需用户设计复杂的阈值算法,即可实现生成各种风格的文档图像,并且去除文档图像的污渍等。其中,具体的图像处理方在后续的实施例中进行详细的说明。请参阅图1,图1示出了本申请一个实施例提供的图像处理方法的流程示意图。所述图像处理方法通过能根据输入的文档图像,输出具有指定页面风格的文档图像的图像生成模型,对文档图像进行处理而生成指定页面风格的文档图像,实现无需用户设计复杂的阈值算法,即可实现生成各种风格的文档图像,并且去除文档图像的污渍等。在具体的实施例中,所述图像处理方法应用于如图7所示的图像处理装置400以及配置有所述图像处理装置400的电子设备100(图9)。下面将以电子设备为例,说明本实施例的具体流程,当然,可以理解的,本实施例所应用的电子设备可以为智能手机、平板电脑、个人计算机(personalcomputer,PC)、笔记本电脑、服务器等,在此不做限定。下面将针对图1所示的流程进行详细的阐述,所述图像处理方法具体可以包括以下步骤:步骤S110:获取第一文档图像。在本申请实施例中,电子设备可以获取需要进行处理的第一文档图像。第一文档图像中至少包括文字内容,文字内容的具体类型可以不作为限定,例如汉字、甲骨文文字、象形文字等。在一些实施方式中,第一文档图像可以是纸质文档的拍摄图像,例如古籍文档的拍摄图像、现代书籍的拍摄图像等;第一文档图像也可以是页面上生成的包括文字内容的电子图像,例如根据文档生成软件中生成的文档所生成的图像,在此不作限定。在一些实施方式中,第一文档图像可以由电子设备采集,也可以由电子设备预先存储,也可以由电子设备从其他设备获取,在此不作限定。步骤S120:将所述第一文档图像输入至已训练的图像生成模型,所述图像生成模型由生成式对抗网络训练得到,所述图像生成模型用于根据输入的文档图像,输出具有唯一指定页面风格的文档图像。在本申请实施例中,电子设备可以将第一文档图像输入至图像生成模型,从而图像生成模型对第一文档图像进行处理,将第本文档来自技高网
...

【技术保护点】
1.一种图像处理方法,其特征在于,所述方法包括:/n获取第一文档图像;/n将所述第一文档图像输入至已训练的图像生成模型,所述图像生成模型由生成式对抗网络训练得到,所述图像生成模型用于根据输入的文档图像,输出具有唯一指定页面风格的文档图像;/n获得所述图像生成模型基于所述第一文档图像输出的第二文档图像,所述第二文档图像具有所述指定页面风格。/n

【技术特征摘要】
1.一种图像处理方法,其特征在于,所述方法包括:
获取第一文档图像;
将所述第一文档图像输入至已训练的图像生成模型,所述图像生成模型由生成式对抗网络训练得到,所述图像生成模型用于根据输入的文档图像,输出具有唯一指定页面风格的文档图像;
获得所述图像生成模型基于所述第一文档图像输出的第二文档图像,所述第二文档图像具有所述指定页面风格。


2.根据权利要求1所述的方法,其特征在于,所述图像生成模型通过如下步骤训练得到:
获取训练数据集合,所述训练数据集合包括多张文档图像以及多张风格图像,所述风格图像为具有所述指定页面风格的文档图像;
获取生成式对抗网络;
根据所述训练数据集合,对所述生成式对抗网络进行迭代训练,直至所述生成式对抗网络收敛,获得所述图像生成模型。


3.根据权利要求2所述的方法,其特征在于,所述生成式对抗网络包括生成器、判别器以及边缘检测器,其中,
所述生成器用于根据输入的文档图像输出风格变化后的图像;
所述判别器用于判断所述生成器输出的文档图像是否为所述训练数据集合中的图像,以及用于对所述输出的文档图像进行图像域的分类,所述图像域包括源域以及目标域;
所述边缘检测器用于根据输入的文档图像而输出边缘图像。


4.根据权利要求3所述的方法,其特征在于,所述根据所述训练数据集合,对所述生成式对抗网络进行迭代训练,直至所述生成式对抗网络收敛,获得所述图像生成模型,包括:
根据所述训练数据集合以及所述边缘检测器,对所述判别器以及所述生成器进行交替迭代训练,直至所述生成式对抗网络收敛,将训练后的生成器作为所述图像生成模型。


5.根据权利要求4所述的方法,其特征在于,所述根据所述训练数据集合以及所述边缘检测器,对所述判别器以及所述生成器进行交替迭代训练,直至所述生成式对抗网络收敛,将训练后的生成器作为所述图像生成模型,包括:
获取损失函数,所述损失函数用于表征所述判别器对所述生成器生成的图像的判别损失、所述生成器对生成的图像的重建损失、所述生成器对生成的图像的边缘损失以及所述判别器对所述生成器生成的图像的图像域的分类损失;
根...

【专利技术属性】
技术研发人员:刘钰安
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1