一种基于混合的场景文本图像超分辨率方法及系统技术方案

技术编号：42482827 阅读：27 留言：0更新日期：2024-08-21 13:02

本发明专利技术公开了一种基于混合的场景文本图像超分辨率方法及系统，涉及图像重建技术领域，将低分辨率图像输送到已训练完成的图像网络模型中，以输出图像的超分辨率结果；图像网络模型的训练为：构建训练集，对低分辨率的场景文本图像进行图像重建，得到通用超分辨率图像；分别对低分辨率的场景文本图像和通用超分辨率图像提取文本框，然后通过缩放处理，得到对应的文本行图像；对每一个低分辨率文本行图像，生成对应的重建超分辨率文本行图像；将每一个重建超分辨率文本行图像融入到超分辨率文本行图像位置，得到低分辨率的场景文本图像的超分辨率结果；该场景文本图像超分辨率方法及系统提升了大场景文本图像超分辨率的准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像重建，尤其涉及一种基于混合的场景文本图像超分辨率方法及系统。

技术介绍

1、图像超分辨率任务是计算机视觉和人工智能领域的核心问题，其核心在于通过光学及相关知识，对低分辨率图像进行处理，以恢复对应的高分辨率图像。目前，这一技术已在卫星遥感图像、医学影像、视频监控和工业检测等多个领域成功应用。

2、近年来，随着深度学习在自动学习特征方面的突破，图像超分辨率技术得到了显著增强，成为计算机视觉和图像处理领域的关键工具。其研究方向主要包括单图像超分辨率和场景文本图像超分辨率。单图像超分辨率旨在通过处理低分辨率图像的输入，推测出高分辨率图像的输出。而场景文本图像超分辨率则专注于从给定的低分辨率输入中恢复视觉上具有轻松可读文本内容的高分辨率场景文本图像。

3、然而，目前的场景文本图像超分辨率方法通常对输入文本长度有限制，仅适用于简短的一行文本。与此同时，单图像超分辨率算法的结果在文本可读性方面尚存在改进的空间。因此，实现对大场景文本图像进行高效超分辨率仍然是一个亟待解决的问题。

技术实现思路<本文档来自技高网...

【技术保护点】

1.一种基于混合的场景文本图像超分辨率方法，其特征在于，将低分辨率图像输送到已训练完成的图像网络模型中，以输出低分辨率图像的超分辨率结果；

2.根据权利要求1所述的基于混合的场景文本图像超分辨率方法，其特征在于，在步骤S2中，单图像超分辨率模型包括浅层特征提取模块、深层特征提取模块和高质量图像重建模块，所述浅层特征提取模块包括一个卷积层，所述深层特征提取模块包括多层依次连接的特征提取层，上一层特征提取层的输出作为下一层特征提取层的输入，最后一个特征提取层的输出作为深层特征提取模块的输出，所述单图像超分辨率模型对低分辨率的场景文本图像进行图像重建过程如下：</p>

3.根据...

【技术特征摘要】

2.根据权利要求1所述的基于混合的场景文本图像超分辨率方法，其特征在于，在步骤s2中，单图像超分辨率模型包括浅层特征提取模块、深层特征提取模块和高质量图像重建模块，所述浅层特征提取模块包括一个卷积层，所述深层特征提取模块包括多层依次连接的特征提取层，上一层特征提取层的输出作为下一层特征提取层的输入，最后一个特征提取层的输出作为深层特征提取模块的输出，所述单图像超分辨率模型对低分辨率的场景文本图像进行图像重建过程如下：

3.根据权利要求2所述的基于混合的场景文本图像超分辨率方法，其特征在于，损失函数生成如下：

4.根据权利要求1所述的基于混合的场景文本图像超分辨率方法，其特征在于，在步骤s3中，将超分辨率文本框缩小到低分辨率的场景文本图像位置形成重合区域，扩大重合区域中重合度最大的一个低分辨率文本框，以覆盖所有超分辨率文本框，具体为：

5.根据权利要求1所述的基于混合的场景文本图像超分辨率方法...

【专利技术属性】
技术研发人员：张信明，姜菲洋，马金，陈一凡，
申请(专利权)人：中国科学技术大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人