中文文本图像的超分辨率重建方法技术

技术编号:33835590 阅读:38 留言:0更新日期:2022-06-16 11:50
本发明专利技术公开了中文文本图像的超分辨率重建方法,包括:获取中文文本图像的数据集,将数据集分为训练集和测试集,并对训练集中的中文文本图像进行预处理,得到低分辨率图片;构建超分辨率重建网络模型,超分辨率重建网络模型的结构包括依次设置的去噪模块、卷积模块、残差模块、上采样模块、特征重映射模块,卷积模块、残差模块的输出通过跳跃连接相连,作为上采样模块的输入;将训练集和测试集输入超分辨率重建网络模型进行学习,并对超分辨率重建网络模型参数进行优化,得到中文文本图像超分辨率模型;利用中文文本图像超分辨率模型对中文文本图像进行图像超分辨率处理。解决了现有技术中存在的带有运动模糊的中文文本图像识别准确率低的问题。准确率低的问题。准确率低的问题。

【技术实现步骤摘要】
中文文本图像的超分辨率重建方法


[0001]本专利技术属于图像处理方法
,涉及一种中文文本图像的超分辨率重建方法。

技术介绍

[0002]中文文本图像主要包括手写中文文档、手写支票、书稿等诸多类型,为了让计算机对这些中文文本图像进行识别操作,并且提高识别的准确率,就需要对这些图像进行预处理,其中常见的预处理操作包括:去噪、锐化、超分辨率等。传统的基于图像处理算法的超分辨率重建算法对于一般图像(风景、照片等)有较广的适用范围,但其对于中文文本图像的适用程度较低,如果直接将其作用于文本图像,往往效果不是很理想。并且使用器材进行拍摄时,由于手部的抖动会导致拍摄出的图像存在运动模糊的情况,这样会导致识别的准确率大大降低。综上所述,目前对于中文文本图像进行超分辨率重建存在重建结果不理想,原图像带有一定噪声,导致对中文文本图像直接进行识别准确率低的问题。

技术实现思路

[0003]本专利技术的目的是提供一种中文文本图像的超分辨率重建方法,解决了现有技术中存在的带有运动模糊的中文文本图像识别准确率低的问题。
[0004]本专利技术所采用的技术方案是,中文文本图像的超分辨率重建方法,包括以下步骤:
[0005]步骤1、获取中文文本图像的数据集,将数据集分为训练集和测试集,并对训练集中的中文文本图像进行预处理,得到低分辨率图片;
[0006]步骤2、构建超分辨率重建网络模型,超分辨率重建网络模型的结构包括依次设置的去噪模块、卷积模块、残差模块、上采样模块、特征重映射模块,卷积模块、残差模块的输出通过跳跃连接相连,作为上采样模块的输入;
[0007]步骤3、将训练集和测试集输入超分辨率重建网络模型进行学习,并对超分辨率重建网络模型参数进行优化,得到中文文本图像超分辨率模型;
[0008]步骤4、利用中文文本图像超分辨率模型对中文文本图像进行图像超分辨率处理。
[0009]本专利技术的特点还在于:
[0010]步骤1的具体过程为:获取中文文本图像的数据集,将数据集分为训练集和测试集,先对训练集中的中文文本图像加上噪声,然后对有噪声的中文文本图像进行2倍下采样得到低分辨率图片。
[0011]超分辨率重建网络模型的具体操作为:
[0012]将低分辨率图片输入去噪模块进行去噪得到去噪后的低分辨率图片;
[0013]将去噪后的低分辨率图片输入卷积模块进行卷积,输出的第一特征图;
[0014]将第一特征图输入残差模块得到残差;
[0015]将残差与第一特征图利用跳跃连接相加获得第二特征图;
[0016]将第二特征图输入由上采样层、卷积层组成的上采样模块,输出初始高分辨率图
像,然后将初始高分辨率图像输入到特征重映射模块得到高分辨率图片。
[0017]去噪模块包括依次设置的第一卷积块、第二卷积块、第三卷积块、第四卷积块、第五卷积块、第六卷积块、卷积层,输入图像与卷积层的输出通过跳跃连接相连。
[0018]残差模块包括依次设置的10个残差组,每个残差组由卷积层、20个残差注意力增强模块组成,残差注意力增强模块包括依次设置的第一卷积层、激活函数层、第二卷积层、注意力增强模块,残差注意力增强模块的输入与注意力增强模块的输出通过跳跃连接相连。
[0019]注意力增强模块包括依次设置的通道注意力层、空间注意力层;通道注意力层由自适应池化层、卷积层和激活函数层组成;空间注意力层由跳跃连接、卷积层、批量归一化层和Sigmod激活函数层组成。
[0020]通道注意力层的操作为:
[0021]输入X=[x1,L,x
c
,L,x
C
],且输入X包括大小为H
×
W的C个特征图,C为输入X的通道数,先将输入X通过全局平均池化层H
GP
获得通道统计信息z
c

[0022][0023]上式中,x
c
(i,j)是位置(i,j)处的第c个特征x
c

[0024]再将其输入卷积层的权重集合W
D
中,并按照比例r进行降维获得大小为的特征图;之后将的特征图输入ReLU激活函数层与其权重集合W
U
相乘后,按比例r进行升维获得大小为1
×1×
C的特征图,然后获得通道缩放信息s:
[0025]s=f(W
U
δ(W
D
z))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3);
[0026]上式中,f和δ代表ReLU激活函数,W
D
代表卷积层的权重集合,W
U
代表ReLU层的权重集合;
[0027]最后利用通道缩放信息s与输入的特征图x相乘得到通道注意力层输出的通道特征图X


[0028]X

=s
c
*x
c
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)。
[0029]空间注意力层的具体操作为:
[0030]先将通道特征图X

在其各个像素上按通道维度分别进行平均池化操作、最大池化操作,得到两个大小为H
×
W
×
1的池化特征图F
Avg
(X

)、F
Max
(X

);再将F
Avg
(X

)、F
Max
(X

)进行拼接得到一个大小为H
×
W
×
2的特征图,之后将大小为H
×
W
×
2的特征图输入到卷积层中,依次通过卷积操作、批归一化操作、Sigmod激活函数,输出一个大小为H
×
W
×
1的空间注意力特征图M
s
(X

);最后将通道特征图X

与空间注意力特征图M
s
(X

)相乘得到空间特征图X


[0031]M
s
(X

)=σ(f7×7([F
Avg
(X

);F
Max
(X

)]))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5);
[0032]X

=X

*M
s
(X

)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6);
[0033]上式中,f7×7表示卷积核大小为7的卷积操作,[F
Avg
(X

);F
Max<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.中文文本图像的超分辨率重建方法,其特征在于,包括以下步骤:步骤1、获取中文文本图像的数据集,将所述数据集分为训练集和测试集,并对所述训练集中的中文文本图像进行预处理,得到低分辨率图片;步骤2、构建超分辨率重建网络模型,所述超分辨率重建网络模型的结构包括依次设置的去噪模块、卷积模块、残差模块、上采样模块、特征重映射模块,所述卷积模块、残差模块的输出通过跳跃连接相连,作为上采样模块的输入;步骤3、将训练集和测试集输入超分辨率重建网络模型进行学习,并对超分辨率重建网络模型参数进行优化,得到中文文本图像超分辨率模型;步骤4、利用所述中文文本图像超分辨率模型对中文文本图像进行图像超分辨率处理。2.根据权利要求1所述的中文文本图像的超分辨率重建方法,其特征在于,步骤1的具体过程为:获取中文文本图像的数据集,将所述数据集分为训练集和测试集,先对所述训练集中的中文文本图像加上噪声,然后对有噪声的中文文本图像进行2倍下采样得到低分辨率图片。3.根据权利要求1所述的中文文本图像的超分辨率重建方法,其特征在于,所述超分辨率重建网络模型的具体操作为:将低分辨率图片输入去噪模块进行去噪得到去噪后的低分辨率图片;将去噪后的低分辨率图片输入卷积模块进行卷积,输出第一特征图;将所述第一特征图输入残差模块得到残差;将残差与第一特征图利用跳跃连接相加获得第二特征图;将所述第二特征图输入由上采样层、卷积层组成的上采样模块,输出初始高分辨率图像,然后将所述初始高分辨率图像输入到特征重映射模块得到高分辨率图片。4.根据权利要求1所述的中文文本图像的超分辨率重建方法,其特征在于,所述去噪模块包括依次设置的第一卷积块、第二卷积块、第三卷积块、第四卷积块、第五卷积块、第六卷积块、卷积层,所述输入图像与卷积层的输出通过跳跃连接相连。5.根据权利要求1所述的中文文本图像的超分辨率重建方法,其特征在于,所述残差模块包括依次设置的10个残差组,每个残差组由卷积层、20个残差注意力增强模块组成,所述残差注意力增强模块包括依次设置的第一卷积层、激活函数层、第二卷积层、注意力增强模块,所述残差注意力增强模块的输入与注意力增强模块的输出通过跳跃连接相连。6.根据权利要求5所述的中文文本图像的超分辨率重建方法,其特征在于,所述注意力增强模块包括依次设置的通道注意力层、空间注意力层;所述通道注意力层由自适应池化层、卷积层和激活函数层组成;所述空间注意力层由跳跃连接、卷积层、批量归一化层和Sigmod激活函数层组成。7.根据权利要求6所述的中文文本图像的超分辨率重建方法,其特征在于,所述通道注意力层的操作为:输入X=[x1,L,x
c
,L,x
C
],且输入X包括大小为H
×
W的C个特征图,C为输入X的通道数,先将输入X通过全局平均池化层H
GP
获得通道统计信息z
c

上式中,x
c
(i,j)是位置(i,j)处的第c个特征x
c
;再将其输入卷积层的权重集合W
D
中,并按照比例r进行降维获得大小为的特征图;之后将所述的特征图输入ReLU激活函数层与其权重集合W
U
相乘后,按比例r进行升维获得大小为1
×1×
C的特征图,然后获得通道缩放信息s:s=f(W
U
δ(W
D
z))
ꢀꢀꢀꢀꢀꢀ
(3);上式中,f和δ代表ReLU激活函数,W
D
代表卷积层的权重集合,W
U
代表ReLU层的权重集合;最后利用所述通道缩放信息s与输入的特征图x相乘得到通道注意力层输出的通道特征图X

:X

=s
c
*x
c
ꢀꢀꢀꢀꢀꢀꢀ
(4)。8.根据权利要求7所述的中文文本图像的超分辨率重建方法,其特征在于,所述空间注意力层的具体操作为:先将所述通道特征图X

【专利技术属性】
技术研发人员:张九龙罗少淇王志晓屈小娥
申请(专利权)人:西安理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1