一种图像处理方法技术

技术编号:39838144 阅读:5 留言:0更新日期:2023-12-29 16:23
本发明专利技术公开了一种图像处理方法

【技术实现步骤摘要】
一种图像处理方法、装置、电子设备及存储介质


[0001]本专利技术涉及图像处理
,尤其涉及一种图像处理方法

装置

电子设备及存储介质


技术介绍

[0002]近年来,
OCR(Optical Character Recognition
,光学字符识别
)
文本识别任务作为计算机视觉领域的核心问题之一,旨在找出图像中所有的文字信息,进而确定它们的位置和内容

由于文字有不同的外观

形状

尺度和姿态,加上成像时的光照

遮挡等因素干扰,
OCR
文本识别一直是计算机视觉领域极具挑战性的问题之一

由于样本图像拍摄区域有限

成像条件不足等因素而导致的低分辨率图像会对下游任务带来性能下降


技术实现思路

[0003]本专利技术提供了一种图像处理方法

装置

电子设备及存储介质,以解决由于样本图像拍摄区域有限,成像条件不足等因素而导致的低分辨率的问题

[0004]根据本专利技术的一方面,提供了一种图像处理方法,包括:
[0005]获取文本模糊图像,对文本模糊图像进行预处理,得到文本模糊图像的先验图像;
[0006]基于第一处理模型对先验图像和文本模糊图像进行预测处理,得到文本模糊图像的粗预测图像;
[0007]基于第二处理模型对粗预测图像进行残差预测,得到粗预测图像对应的残差图像;
[0008]基于粗预测图像和残差图像确定文本模糊图像对应的超分辨率图像

[0009]可选的,对文本模糊图像进行预处理,得到文本模糊图像的先验图像,包括:
[0010]对文本模糊图像进行二值化处理,得到文本模糊图像的掩码图像,将掩码图像作为文本模糊图像的先验图像;或者,
[0011]对文本模糊图像进行图像分割,得到分割图像,将分割图像作为文本模糊图像的先验图像

[0012]可选的,在得到文本模糊图像的先验图像之后还包括:
[0013]对先验图像进行至少一层的特征提取,得到先验图像的特征图像;
[0014]相应的,基于第一处理模型对先验图像和文本模糊图像进行预测处理,得到文本模糊图像的粗预测图像,包括:
[0015]基于第一处理模型对先验图像的特征图像和文本模糊图像进行预测处理,得到文本模糊图像的粗预测图像

[0016]可选的,基于第二处理模型对粗预测图像进行残差预测,得到粗预测图像对应的残差图像,包括:
[0017]迭代执行如下处理过程,直到满足迭代结束条件,得到粗预测图像对应的残差图像:
[0018]获取当前次的迭代图像

当前迭代次数和粗预测图像;其中,当前次的迭代图像为第二处理模型在上一次迭代输出图像或者首次输入的初始图像;
[0019]将当前次的迭代图像

当前迭代次数和粗预测图像输入至第二处理模型,得到当前次迭代输出的图像

[0020]可选的,方法还包括:
[0021]确定不同次迭代输出图像的损失数据,基于损失数据确定是否满足迭代结束条件,迭代结束条件包括:不同次迭代输出图像的损失数据达到收敛状态,或者,当前次迭代输出的图像的损失数据小于预设值

[0022]可选的,基于粗预测图像和残差图像确定文本模糊图像对应的超分辨率图像,包括:
[0023]将粗预测图像和残差图像的对应像素点进行像素值相加,得到超分辨率图像

[0024]可选的,第一处理模型为
U

NET
网络模型,第二处理模型为扩散模型;
[0025]第一处理模型基于模糊样本图像和清晰标签图像训练得到,其中,模糊样本图像通过对清晰标签图像进行模糊处理得到;
[0026]第二处理模型基于第一处理模型对模糊样本图像的粗预测图像,以及模糊样本图像和清晰标签图像的差异标签图像训练得到

[0027]根据本专利技术的另一方面,提供了一种图像处理装置,其特征在于,包括:
[0028]先验图像获取模块,用于获取文本模糊图像,对文本模糊图像进行预处理,得到文本模糊图像的先验图像;
[0029]粗预测图像确定模块,用于基于第一处理模型对先验图像和文本模糊图像进行预测处理,得到文本模糊图像的粗预测图像;
[0030]残差图像确定模块,用于基于第二处理模型对粗预测图像进行残差预测,得到粗预测图像对应的残差图像;
[0031]超分辨率图像确定模块,用于基于粗预测图像和残差图像确定文本模糊图像对应的超分辨率图像

[0032]根据本专利技术的另一方面,提供了一种电子设备,电子设备包括:
[0033]至少一个处理器;以及
[0034]与至少一个处理器通信连接的存储器;其中,
[0035]存储器存储有可被至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器能够执行本专利技术任一实施例的图像处理方法

[0036]根据本专利技术的另一方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,计算机指令用于使处理器执行时实现本专利技术任一实施例的图像处理方法

[0037]本专利技术实施例的技术方案,通过获取文本模糊图像,对文本模糊图像进行预处理,得到文本模糊图像的先验图像;基于第一处理模型对先验图像和文本模糊图像进行预测处理,得到文本模糊图像的粗预测图像;基于第二处理模型对粗预测图像进行残差预测,得到粗预测图像对应的残差图像;基于粗预测图像和残差图像确定文本模糊图像对应的超分辨率图像,通过本方案可以得到文本模糊图像对应的超分辨率图像,解决了由于样本图像拍摄区域有限

成像条件不足等多种因素而导致的低分辨率的问题,提高了文本模糊图像去
模糊效果,提升了文本模糊图像的分辨率,也使得得到的超分辨率图像更加具有高质量和高准确度

[0038]应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围

本专利技术的其它特征将通过以下的说明书而变得容易理解

附图说明
[0039]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图

[0040]图1是本专利技术实施例一提供的一种图像处理方法的流程图;
[0041]图2是本专利技术实施例二提供的一种图像处理方法的流程图;
[0042]图3是本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种图像处理方法,其特征在于,包括:获取文本模糊图像,对所述文本模糊图像进行预处理,得到所述文本模糊图像的先验图像;基于第一处理模型对所述先验图像和所述文本模糊图像进行预测处理,得到所述文本模糊图像的粗预测图像;基于第二处理模型对所述粗预测图像进行残差预测,得到所述粗预测图像对应的残差图像;基于所述粗预测图像和所述残差图像确定所述文本模糊图像对应的超分辨率图像
。2.
根据权利要求1所述的方法,其特征在于,所述对所述文本模糊图像进行预处理,得到所述文本模糊图像的先验图像,包括:对所述文本模糊图像进行二值化处理,得到所述文本模糊图像的掩码图像,将所述掩码图像作为所述文本模糊图像的先验图像;或者,对所述文本模糊图像进行图像分割,得到分割图像,将所述分割图像作为所述文本模糊图像的先验图像
。3.
根据权利要求1所述的方法,其特征在于,在得到所述文本模糊图像的先验图像之后还包括:对所述先验图像进行至少一层的特征提取,得到所述先验图像的特征图像;相应的,所述基于第一处理模型对所述先验图像和所述文本模糊图像进行预测处理,得到所述文本模糊图像的粗预测图像,包括:基于第一处理模型对所述先验图像的特征图像和所述文本模糊图像进行预测处理,得到所述文本模糊图像的粗预测图像
。4.
根据权利要求1所述的方法,其特征在于,所述基于第二处理模型对所述粗预测图像进行残差预测,得到所述粗预测图像对应的残差图像,包括:迭代执行如下处理过程,直到满足迭代结束条件,得到粗预测图像对应的残差图像:获取当前次的迭代图像

当前迭代次数和所述粗预测图像;其中,所述当前次的迭代图像为所述第二处理模型在上一次迭代输出图像或者首次输入的初始图像;将所述当前次的迭代图像

当前迭代次数和所述粗预测图像输入至所述第二处理模型,得到当前次迭代输出的图像
。5.
根据权利要求4所述的方法,其特征在于,所述方法还包括:确定不同次迭代输出图像的损失数据,基于所述损失数据确定是否满足所述迭代结...

【专利技术属性】
技术研发人员:黎安
申请(专利权)人:联仁健康医疗大数据科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1