一种超分辨率重建方法及装置、电子设备、存储介质制造方法及图纸

技术编号:46194612 阅读:18 留言:0更新日期:2025-08-22 18:51
本公开是关于一种超分辨率重建方法及装置、电子设备、存储介质。该方法可以包括:获取原始图像,并对所述原始图像中包含的原始文字进行特征提取,得到所述原始文字的位置特征向量和语义特征向量;在字典库所含的候选文字中检索与所述语义特征向量相匹配的目标文字,并确定所述字典库中记录的与所述目标文字对应的目标文字结构特征向量;将所述原始图像、所述位置特征向量、所述目标文字结构特征向量输入预训练的超分辨率重建模型,并获取所述超分辨率重建模型输出的重建后图像,所述重建后图像包含对所述原始文字进行超分辨率重建得到的优化后文字。通过本公开的技术方案,可以有效提升重建得到的优化后文字的准确性和可读性。

【技术实现步骤摘要】

本公开涉及数据处理,尤其涉及一种超分辨率重建方法及装置、电子设备、存储介质


技术介绍

1、场景文本理解在计算机视觉任务中扮演着十分重要的角色。目前,终端设备的相机受限于硬件尺寸和成本,使得成像得到的图像的分辨率较低。此类低分辨率图像中文本的形状和轮廓通常是模糊的,不利于场景文本理解。

2、相关技术中,在图像超分分支外增加文字先验分支来解决上述问题。其中,文字先验分支用于提取原始图像中文字的序列特征向量。将该序列特征向量与图像超分分支输出的图像特征向量进行融合,以提升原始图像中文字区域的超分辨率重建效果。然而,上述文字的序列特征向量中所包含的文字结构信息并不一定是准确的。比如,针对原始图像中包含的粘连文字、存在部分结构缺失的文字以及清晰度较低的文字,其提取出的序列特征向量中包含的文字结构信息是模糊的、不完整的。因而,基于该模糊的、不完整的序列特征向量进行超分辨率重建,容易导致重建得到的优化后文字不够准确,进而大大降低了优化后文字的可读性,不利于实现较好的场景文本理解效果。


技术实现思路p>

1、本公开本文档来自技高网...

【技术保护点】

1.一种超分辨率重建方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,

3.根据权利要求1所述的方法,其特征在于,所述对所述原始图像中包含的原始文字进行特征提取,得到所述原始文字的位置特征向量,包括:

4.根据权利要求3所述的方法,其特征在于,还包括:

5.根据权利要求1所述的方法,其特征在于,在提取所述原始文字的语义特征向量之前,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述字典库还包括所述候选文字对应的候选文字风格特征向量,所述方法还包括:提取所述原始文字的文字风格特征向量;

...

【技术特征摘要】

1.一种超分辨率重建方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,

3.根据权利要求1所述的方法,其特征在于,所述对所述原始图像中包含的原始文字进行特征提取,得到所述原始文字的位置特征向量,包括:

4.根据权利要求3所述的方法,其特征在于,还包括:

5.根据权利要求1所述的方法,其特征在于,在提取所述原始文字的语义特征向量之前,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述字典库还包括所述候选文字对应的候选文字风格特征向量,所述方法还...

【专利技术属性】
技术研发人员:李永强宋小鸿
申请(专利权)人:北京小米移动软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1