当前位置: 首页 > 专利查询>南通大学专利>正文

基于增强边缘先验的场景文字图像超分辨率方法技术

技术编号:43352064 阅读:19 留言:0更新日期:2024-11-19 17:39
本发明专利技术公开了一种基于增强边缘先验的场景文字图像超分辨率方法,包括如下步骤:采集场景文字图像;构建基于边缘增强像素注意力先验的场景文本图像超分辨率框架EEP,其中,超分辨率框架EEP包括:边缘增强模块、多尺度特征提取模块、文本先验模块和图像重建模块;将采集的场景文字图像输入EEP框架,生成高分辨率图像;其中,EEP采用Canny检测算子来获取边缘特征图;采用多个具有不同扩张率的空洞卷积层结合像素注意力网络以提取多尺度图像特征;添加新型序列重建残差块。本发明专利技术提出的框架是增强边缘先验的场景文字图像超分辨率架构,利用文本先验指导图像超分辨率重建,得到更好的保真率和清晰度。

【技术实现步骤摘要】

本专利技术属于图像处理领域,具体涉及一种基于增强边缘先验的场景文字图像超分辨率方法


技术介绍

1、在日常生活中,随着文本相关应用需求的迅猛增长,场景文本识别(str)由于其在文档检索和智能监控等领域的广泛应用,已成为计算机视觉领域的研究焦点。尽管现代文本识别模型在清晰的文本图像上已取得了印象深刻的成果,然而现实场景中常见的低分辨率文本图像由于远距离传输、图像压缩或使用低质量摄像头等原因,通常呈现各种退化模式,使得获得适合文本识别器识别的清晰文本图像变得尤为困难。因此,场景文本图像超分辨率(stisr)作为一种提升低分辨率(lr)文本图像准确度和保真度的技术,已受到学术界的广泛关注。该技术的发展预计将极大地促进下游识别任务的性能。

2、早期的场景文本图像超分辨率(stisr)方法主要是将传统的超分辨率(sr)框架直接应用于文本图像。场景文本图像超分辨率(stisr)旨在使用超分辨率技术提升包含文本的图像的清晰度和分辨率,并能识别出语义正确的文本。场景文本识别任务主要涉及从自然场景中识别文字信息,与从标准文档图像中识别文字相比,难度显著增加。文本本文档来自技高网...

【技术保护点】

1.基于增强边缘先验的场景文字图像超分辨率方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的方法,其特征在于,边缘增强模块采用Canny检测算子对低分辨率图像LR进行处理得到边缘特征图,将边缘特征图与原始输入低分辨率图像拼接形成边缘增强特征图;

3.根据权利要求1所述的方法,其特征在于,多尺度特征提取模块由空洞卷积分支、1×1卷积分支和池化分支组成,其中,空洞卷积分支包括三个3×3空洞卷积模块和像素注意力,三个3×3空洞卷积模块的扩张率分别为1、2、5;输入经过三个空洞卷积后再次经过像素注意力模块;池化分支经过1×1池化、1×1卷积和上采样;将所有分支结果...

【技术特征摘要】

1.基于增强边缘先验的场景文字图像超分辨率方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的方法,其特征在于,边缘增强模块采用canny检测算子对低分辨率图像lr进行处理得到边缘特征图,将边缘特征图与原始输入低分辨率图像拼接形成边缘增强特征图;

3.根据权利要求1所述的方法,其特征在于,多尺度特征提取模块由空洞卷积分支、1×1卷积分支和池化分支组成,其中,空洞卷积分支包括三个3×3空洞卷积模块和像素注意力,三个3×3空洞卷积模块的扩张率分别为1、2、5;输入经过三个空洞卷积后再次经过像素注意力模块;池化分支经过1×1池化、1×1卷积和上采样;将所有分支结果进行拼接并进行1×1卷积得到多尺度增强特征图作为多尺度特征提取模块的输出。

4.根据权利要求3所述的方法,其特征在于,空洞卷积的具体公式为:

5.根据权利要求1所述的方法...

【专利技术属性】
技术研发人员:谢正光李尚峰李洪均
申请(专利权)人:南通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1