【技术实现步骤摘要】
文本图像超分辨率网络的训练方法、装置以及存储介质
[0001]本公开涉及图像
,特别涉及一种文本图像超分辨率网络的训练方法、装置以及存储介质。
技术介绍
[0002]对于一些图像分辨率低的文本图像,该文本图像的文本信息一般比较模糊,为了能够识别出该文本图像中模糊的文本信息,计算机设备通过文本图像超分辨率网络对该文本图像进行超分辨率重构,得到图像分辨率高于该文本图像的目标文本图像。
[0003]在相关技术中,计算机设备通过训练集中的文本图像,对文本图像超分辨率网络进行训练。在训练过程中,计算机设备还基于多个损失函数,对文本图像分辨率网络的训练进行监督。
[0004]但是,这多个损失函数中的部分损失函数依靠训练集中文本图像的标签收敛,而另一部分损失函数依靠训练集中文本图像的高图像分辨率文本图像收敛,因此,多个损失函数之间存在收敛点冲突的问题,使得在训练过程中多个损失函数不容易同时收敛,进而阻碍训练过程中文本图像超分辨率网络的迭代优化,导致通过该文本图像超分辨率网络超分辨率重构后的图像的显示效果较差。 >
技术实现思路
...
【技术保护点】
【技术特征摘要】
1.一种文本图像超分辨率网络的训练方法,其特征在于,包括:获取第一文本图像和第二文本图像,所述第一文本图像和所述第二文本图像所描述的内容相同,所述第一文本图像的图像分辨率低于所述第二文本图像的图像分辨率;将所述第一文本图像输入待训练的文本图像超分辨率网络,通过所述文本图像超分辨率网络对所述第一文本图像进行超分辨率重构,输出第三文本图像;基于所述第二文本图像和所述第三文本图像,确定像素损失值以及文本损失值,所述像素损失值用于表示所述第二文本图像与所述第三文本图像在像素上的差异程度,所述文本损失值用于表示所述第二文本图像与所述第三文本图像在文本信息上的差异程度;基于所述像素损失值以及所述文本损失值,对所述文本图像超分辨率网络进行训练,得到训练完成的文本图像超分辨率网络。2.根据权利要求1所述的文本图像超分辨率网络的训练方法,其特征在于,所述基于所述像素损失值以及所述文本损失值,对所述文本图像超分辨率网络进行训练包括:对所述像素损失值以及所述文本损失值进行融合处理,得到目标损失值,所述目标损失值用于表示所述第二文本图像与所述第三文本图像之间的差异程度;在所述目标损失值大于或等于损失阈值的情况下,对所述文本图像超分辨率网络的网络参数进行更新,对更新后的文本图像超分辨率网络进行下一次训练;若所述目标损失值小于所述损失阈值,结束训练,其中,结束训练的更新后的文本图像超分辨率网络为所述训练完成的文本图像超分辨率网络。3.根据权利要求1所述的文本图像超分辨率网络的训练方法,其特征在于,所述文本损失值通过下述方式得到:分别对所述第二文本图像以及所述第三文本图像进行多次带下采样的卷积操作,得到多个第一特征图以及多个第二特征图,所述多个第一特征图和所述多个第二特征图一一对应,对应的第一特征图和第二特征图的尺度相同,所述第一特征图用于表征下采样后的所述第二文本图像的图像信息,所述第二特征图用于表征下采样后的所述第三文本图像的图像信息;基于所述多个第一特征图以及所述多个第二特征图,确定所述文本损失值,所述文本损失值用于表示所述第二文本图像以及所述第三文本图像的文本信息在多个尺度上的差异程度。4.根据权利要求3所述的文本图像超分辨率网络的训练方法,其特征在于,所述基于所述多个第一特征图以及所述多个第二特征图,确定所述文本损失值包括:基于所述多个第一特征图以及所述多个第二特征图,确定多个单尺度文本损失值,所述单尺度文本损失值用于表示相同尺度的第一特征图以及第二特征图之间的差异程度;对所述多个单尺度文本损失值进行融合处理,得到所述文本损失值。5.根据权利要求1所述的文本图像超分辨率网络的训练方法,其特征在于,所述像素损失值通过下述方式得到:基于所述第二文本图像的像素值以及所述第三文本图像的像素值,确定像素均方差损失值,所述像素均方差损失值用于表示所述第二文本图像与所述第三文本图像在像素颜色上的差异程度;基于所述第二文本图像以及第三文本图像,确定梯度轮廓损失值,所述梯度轮廓损失
值用于表示所述第二文本图像与所述第三文本图像中文本信息边缘的像素梯度之间的差异程度;对所述像素均方差损失值以及所述梯度轮廓损失值进行融合处理,得到所述像素损失值。6.根据权利要求1
‑
5中任一项所述的文本图像超分辨率网络的训练方法,其特征在于,所述通过所述文本图像超分辨率网络对所述第一文本图像进行超分辨率重构,输出第三文本图像包括:通过所述文本图像超分辨率网络,基于所述第一文本图像的第三特征图,对所述第一文本图像中的文本信息进行重构,得到文本特征图,所述第三特征图用于表示所述第一文本图像的特征,所述文本特征图用于表示重构后的文本信息的特征;通过所述文本图像超分辨率网络,基于所述第三特征图以及所述文本特征图,输出所述第三文本图像。7.根据权利要求6所述的文本图像超分辨率网络的训练方法,其特征在于,所述通过所述文本图像超分辨率网络,基于所述第一文本图像的第三特征图,对所述第一文本图像中的文本信息进行重构,得到文本特征图包括:通过所述文本图像超分辨率网络,基于所述第三特征图,对所述第一文本图像中像素点的列特征以及行特征进行多次迭代交叉提取,得到所述文本特征图。8.根据权利要求7所述的文本图像超分辨率网络的训练方法,其特征在于,所述通过所述文本图像超分辨率网络,基于所述第三特征图,对所述第一文本图像中像素点的列特征以及行特征进行多次迭代交叉提取包括:在任一次迭代交叉提取的过程中,通过所述文本图像超分辨率网络,基于所述第一文本图像的第四特征图,对所述第一文本图像中像素点的第一像素特征进行提取,得到第五特征图,所述第四特征图为所述第三特征图或上一次迭代交叉提取过程中得到的中间特征图,所述第一像素特征为像素点的列特征或行特征;通过所述文本图像超分辨率网络,基于所述第五特征图,对所述第一文本图像中像素点的第二像素特征进行提取,得到第六特征图,所述第二像素特征为像素点的列特征和行特征中除所述第一像素特征以外的特征;通过所述文本图像超分辨率网络,对所述第六特征图与所述第四特征图进行融合处理,得到中间特征图。9.根据权利要求8所述的文本图像超分辨率网...
【专利技术属性】
技术研发人员:秦睿,戴宇荣,王斌,
申请(专利权)人:北京达佳互联信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。