一种场景文本图像超分辨率方法技术

技术编号：41966559 阅读：22 留言：0更新日期：2024-07-10 16:48

本发明专利技术公开了一种场景文本图像超分辨率方法，特点是获取原始的低分辨率文本图像并输入至预处理模块中，得到初始细化图形、结构先验和语义先验；将初始细化图形、结构先验和语义先验输入至多尺度先验学习模块中进行特征提取，得到多尺度结构特征和多尺度语义特征；将多尺度结构特征和多尺度语义特征输入至先验融合模块中进行融合，得到超分辨率图像；优点是通过结构和语义先验特征与初始细化图像的多尺度交互增强，使得先验特征充分学习原始图像特征信息，提升了场景文本图像超分辨重建能力，从而提高了识别精度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种超分辨率方法，尤其是一种场景文本图像超分辨率方法。

技术介绍

1、自然场景文本图像中包含着丰富的语义信息，广泛应用于文档识别、自动驾驶和多等领域。然而，场景文本图像中往往存在结构模糊、分辨率较低等问题，导致难以检测。场景文本图像超分辨率(scene text image super resolution，stisr)是解决上述问题的关键技术，它能够有效提升文本图像质量，将低分辨率(low resolution，lr)图像复原为高分辨率(high resolution，hr)图像。

2、当前stisr技术主要分为传统方法和深度学习方法。传统方法依赖于低级特征(如纹理和颜色信息)和人工设计的特征处理器，成本高昂且难以捕捉到高级语义信息，往往无法还原图像中的细节信息，逐渐被研究者摒弃。而基于深度学习的stisr方法能够自动学习图像中的高级特征和语义信息，同时不需要手工设计复杂的特征提取器，这使得模型能够更好地通过深层抽象特征来学习数据的复杂表示，增强表征能力，有助于解决光照、失真等复杂环境下的文本图像超分任务，被...

【技术保护点】

1.一种场景文本图像超分辨率方法，包括以下步骤：步骤①获取原始的低分辨率文本图像；步骤②将原始的低分辨率文本图像输入至预训练的场景文本图像超分辨率网络MSPIE中，输出超分辨率图像；

2.根据权利要求1所述的一种场景文本图像超分辨率方法，其特征在于所述的得到结构先验和语义先验的具体操作过程如下：

3.根据权利要求2所述的一种场景文本图像超分辨率方法，其特征在于所述的特征交互为两次1×1卷积操作。

4.根据权利要求1所述的一种场景文本图像超分辨率方法，其特征在于所述的多尺度先验学习模块MSPLM由结构细化分支STB和语义细化分支SEB组成，所述的结构细化...

【技术特征摘要】

1.一种场景文本图像超分辨率方法，包括以下步骤：步骤①获取原始的低分辨率文本图像；步骤②将原始的低分辨率文本图像输入至预训练的场景文本图像超分辨率网络mspie中，输出超分辨率图像；

2.根据权利要求1所述的一种场景文本图像超分辨率方法，其特征在于所述的得到结构先验和语义先验的具体操作过程如下：

3.根据权利要求2所述的一种场景文本图像超分辨率方法，其特征在于所述的特征交互为两次1×1卷积操作。

4.根据权利要求1所述的一种场景文本图像超分辨率方法，其特征在于所述的多尺度先验学习模块msplm由结构细化分支stb和语义细化分支seb组成，所述的结构细化分支stb由采用级联方式连接的三个第一先验融合交互模块组成，所述的语义细化分支seb由采用级联方式连接的三个第二先验融合交互模块组成；

5.根据权利要求4所述的一种场景文本图像超分辨率方法，其特征在于所述的第...

【专利技术属性】
技术研发人员：朱仲杰，张磊，白永强，李沛，卢豫哲，
申请(专利权)人：浙江万里学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人