【技术实现步骤摘要】
本公开涉及数据处理,尤其涉及一种超分辨率重建方法及装置、电子设备、存储介质。
技术介绍
1、场景文本理解在计算机视觉任务中扮演着十分重要的角色。目前,终端设备的相机受限于硬件尺寸和成本,使得成像得到的图像的分辨率较低。此类低分辨率图像中文本的形状和轮廓通常是模糊的,不利于场景文本理解。
2、相关技术中,在图像超分分支外增加文字先验分支来解决上述问题。其中,文字先验分支用于提取原始图像中文字的序列特征向量。将该序列特征向量与图像超分分支输出的图像特征向量进行融合,以提升原始图像中文字区域的超分辨率重建效果。然而,上述文字的序列特征向量中所包含的文字结构信息并不一定是准确的。比如,针对原始图像中包含的粘连文字、存在部分结构缺失的文字以及清晰度较低的文字,其提取出的序列特征向量中包含的文字结构信息是模糊的、不完整的。因而,基于该模糊的、不完整的序列特征向量进行超分辨率重建,容易导致重建得到的优化后文字不够准确,进而大大降低了优化后文字的可读性,不利于实现较好的场景文本理解效果。
技术实现思路
...【技术保护点】
1.一种超分辨率重建方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,
3.根据权利要求1所述的方法,其特征在于,所述对所述原始图像中包含的原始文字进行特征提取,得到所述原始文字的位置特征向量,包括:
4.根据权利要求3所述的方法,其特征在于,还包括:
5.根据权利要求1所述的方法,其特征在于,在提取所述原始文字的语义特征向量之前,所述方法还包括:
6.根据权利要求1所述的方法,其特征在于,所述字典库还包括所述候选文字对应的候选文字风格特征向量,所述方法还包括:提取所述原始文字的文字风格特征
...
【技术特征摘要】
1.一种超分辨率重建方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,
3.根据权利要求1所述的方法,其特征在于,所述对所述原始图像中包含的原始文字进行特征提取,得到所述原始文字的位置特征向量,包括:
4.根据权利要求3所述的方法,其特征在于,还包括:
5.根据权利要求1所述的方法,其特征在于,在提取所述原始文字的语义特征向量之前,所述方法还包括:
6.根据权利要求1所述的方法,其特征在于,所述字典库还包括所述候选文字对应的候选文字风格特征向量,所述方法还...
【专利技术属性】
技术研发人员:李永强,宋小鸿,
申请(专利权)人:北京小米移动软件有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。