当前位置: 首页 > 专利查询>浙江大学专利>正文

基于轻量化卷积神经网络的文本图像超分辨率方法和系统技术方案

技术编号:45858683 阅读:14 留言:0更新日期:2025-07-19 11:16
本发明专利技术公开了一种基于轻量化卷积神经网络的文本图像超分辨率方法和系统,属于图像超分辨率技术领域。使用低质量文本图像‑真值图像对训练一个轻量化卷积神经网络,实现低质量文本图像的超分辨率重建;训练过程中,提取重建得到的高分辨率文本图像及其真值图像的多层次特征图,利用LSTM网络提取多层次特征图中空间分辨率最小的特征图的记忆信息,生成记忆信息的嵌入向量;分别计算重建得到的高分辨率文本图像及其真值图像的多层次特征图之间的各层次误差、以及记忆信息的嵌入向量之间的记忆误差,将各层次误差和记忆误差之间的加权结果作为训练损失。本发明专利技术能够在非常低的参数量和运算资源消耗下实现优异的重建效果。

【技术实现步骤摘要】

本专利技术属于图像超分辨率,尤其涉及一种基于轻量化卷积神经网络的文本图像超分辨率方法和系统


技术介绍

1、ocr(optical character recognition,光学字符识别)是指使用设备(例如扫描仪或数码相机)记录不同场景下的文字、文本信息,之后通过检测暗亮模式或者边缘确定文字位置及形状,然后用字符识别方法将形状翻译成计算机文字的过程。采用光学的方式将场景中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。如何提高字符识别正确率,是ocr最重要的课题。

2、现在ocr文本识别技术已经在高质量的文本图像上取得了极佳的效果。然而,在识别低质量的模糊文本图像时,ocr的识别率性能急剧下降,其中低质量的原因包括分辨率低、噪声、模糊、jpeg压缩、伪影、振铃现象等等。识别模糊文本图像的主要困难在于图像中缺乏关于字符的细节信息与边缘纹理信息。超分辨率是解决此问题的合理方法。然而,传统的自然场景超分辨率方法将重建全局图像,没有前景背景之分,而文本超分需重点关注文本信息,同时无法利本文档来自技高网...

【技术保护点】

1.一种基于轻量化卷积神经网络的文本图像超分辨率方法,其特征在于,包括:

2.根据权利要求1所述的基于轻量化卷积神经网络的文本图像超分辨率方法,其特征在于,所述第一网络先对低质量文本图像进行通道数扩增,再依次利用卷积层和若干堆叠的第一残差块提取得到图像的浅层特征。

3.根据权利要求1所述的基于轻量化卷积神经网络的文本图像超分辨率方法,其特征在于,所述第二网络包括一个卷积层、若干堆叠的第二残差块和两个并列的、同结构的深层提取分支,先依次利用卷积层和若干堆叠的第二残差块提取得到浅层特征的语义信息,再利用两个深层提取分支从语义信息中分别提取得到第一深层特征和第二深层特征...

【技术特征摘要】

1.一种基于轻量化卷积神经网络的文本图像超分辨率方法,其特征在于,包括:

2.根据权利要求1所述的基于轻量化卷积神经网络的文本图像超分辨率方法,其特征在于,所述第一网络先对低质量文本图像进行通道数扩增,再依次利用卷积层和若干堆叠的第一残差块提取得到图像的浅层特征。

3.根据权利要求1所述的基于轻量化卷积神经网络的文本图像超分辨率方法,其特征在于,所述第二网络包括一个卷积层、若干堆叠的第二残差块和两个并列的、同结构的深层提取分支,先依次利用卷积层和若干堆叠的第二残差块提取得到浅层特征的语义信息,再利用两个深层提取分支从语义信息中分别提取得到第一深层特征和第二深层特征。

4.根据权利要求3所述的基于轻量化卷积神经网络的文本图像超分辨率方法,其特征在于,所述深层提取分支为多层次结构,在每一层中将前一层输出特征作为输入特征执行卷积操作,将卷积操作结果进行非线性激活后,再与输入特征在通道维度拼接,得到当前层输出特征。

5.根据权利要求1所述的基于轻量化卷积神经网络的文本图像超分辨率方法,其特征在于,所述第一融合网络先对语义信息、第一深层特征和第二深层特征在通道维度拼接,再对拼接结果利...

【专利技术属性】
技术研发人员:丁勇余庆刘毅飞
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1