【技术实现步骤摘要】
本专利技术属于图像超分辨率,尤其涉及一种基于轻量化卷积神经网络的文本图像超分辨率方法和系统。
技术介绍
1、ocr(optical character recognition,光学字符识别)是指使用设备(例如扫描仪或数码相机)记录不同场景下的文字、文本信息,之后通过检测暗亮模式或者边缘确定文字位置及形状,然后用字符识别方法将形状翻译成计算机文字的过程。采用光学的方式将场景中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。如何提高字符识别正确率,是ocr最重要的课题。
2、现在ocr文本识别技术已经在高质量的文本图像上取得了极佳的效果。然而,在识别低质量的模糊文本图像时,ocr的识别率性能急剧下降,其中低质量的原因包括分辨率低、噪声、模糊、jpeg压缩、伪影、振铃现象等等。识别模糊文本图像的主要困难在于图像中缺乏关于字符的细节信息与边缘纹理信息。超分辨率是解决此问题的合理方法。然而,传统的自然场景超分辨率方法将重建全局图像,没有前景背景之分,而文本超分需重点关注
...【技术保护点】
1.一种基于轻量化卷积神经网络的文本图像超分辨率方法,其特征在于,包括:
2.根据权利要求1所述的基于轻量化卷积神经网络的文本图像超分辨率方法,其特征在于,所述第一网络先对低质量文本图像进行通道数扩增,再依次利用卷积层和若干堆叠的第一残差块提取得到图像的浅层特征。
3.根据权利要求1所述的基于轻量化卷积神经网络的文本图像超分辨率方法,其特征在于,所述第二网络包括一个卷积层、若干堆叠的第二残差块和两个并列的、同结构的深层提取分支,先依次利用卷积层和若干堆叠的第二残差块提取得到浅层特征的语义信息,再利用两个深层提取分支从语义信息中分别提取得到第一深
...【技术特征摘要】
1.一种基于轻量化卷积神经网络的文本图像超分辨率方法,其特征在于,包括:
2.根据权利要求1所述的基于轻量化卷积神经网络的文本图像超分辨率方法,其特征在于,所述第一网络先对低质量文本图像进行通道数扩增,再依次利用卷积层和若干堆叠的第一残差块提取得到图像的浅层特征。
3.根据权利要求1所述的基于轻量化卷积神经网络的文本图像超分辨率方法,其特征在于,所述第二网络包括一个卷积层、若干堆叠的第二残差块和两个并列的、同结构的深层提取分支,先依次利用卷积层和若干堆叠的第二残差块提取得到浅层特征的语义信息,再利用两个深层提取分支从语义信息中分别提取得到第一深层特征和第二深层特征。
4.根据权利要求3所述的基于轻量化卷积神经网络的文本图像超分辨率方法,其特征在于,所述深层提取分支为多层次结构,在每一层中将前一层输出特征作为输入特征执行卷积操作,将卷积操作结果进行非线性激活后,再与输入特征在通道维度拼接,得到当前层输出特征。
5.根据权利要求1所述的基于轻量化卷积神经网络的文本图像超分辨率方法,其特征在于,所述第一融合网络先对语义信息、第一深层特征和第二深层特征在通道维度拼接,再对拼接结果利...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。