【技术实现步骤摘要】
图像处理方法、装置、计算机设备、存储介质及程序产品
[0001]本申请涉及人工智能、计算机视觉、云计算
,本申请涉及一种图像处理方法、装置、计算机设备、存储介质及程序产品。
技术介绍
[0002]随着科技的发展,许多场景中,可以基于用户拍照的图像进行文字识别,例如,拍照翻译、智能搜题等。然而,用户拍照的图像中存在变形,本领域中,在文字识别之前,通常需要对图像进行处理。
[0003]相关技术中,可利用投影法对图像进行处理,通常对图像进行不同角度的投影,并分析、预估出图像的倾斜角度,根据估计出的倾斜角度,将图像旋转到标准视角。
[0004]然而,在自然场景拍摄的图片,场景较为复杂且各图像区域的光照强度不同,使得上述方法预测的倾斜角度不准确,导致图像处理的准确性较低;且上述方法只能解决纯文本图像的倾斜角度的检测,对于透视变形等复杂场景则无法适用,有较大的局限性。因此,上述图像处理的准确性和实用性较低。
技术实现思路
[0005]本申请提供了一种图像处理方法、装置、计算机设备、存储介质及程序产品 ...
【技术保护点】
【技术特征摘要】
1.一种图像处理方法,其特征在于,所述方法包括:对待视角校正的文本图像提取边缘图和分割图,所述文本图像包括透视变形的文本,所述边缘图用于指示所述文本图像中文本的边缘位置,所述分割图用于指示所述文本图像中文本所在区域;基于所述边缘图所指示的边缘位置的边缘点,确定至少两个候选多边形;基于所述分割图,确定所述至少两个候选多边形中的目标多边形;基于所述目标多边形以及目标尺寸,对所述文本图像进行透视变换,得到视角校正后的目标图像。2.根据权利要求1所述的方法,其特征在于,所述基于所述分割图,确定所述至少两个候选多边形中的目标多边形,包括:根据所述分割图中文本所在区域,确定每个候选多边形中的分割图区域所占比例,所述分割图区域是指候选多边形中属于所述文本所在区域的区域;基于所述每个候选多边形中的分割图区域所占比例、以及所述每个候选多边形的面积,从所述至少两个候选多边形中筛选出符合目标条件的目标多边形。3.根据权利要求1所述的方法,其特征在于,所述基于所述目标多边形以及目标尺寸,对所述文本图像进行透视变换,得到视角校正后的目标图像,包括:基于所述文本图像与所述边缘图之间的缩放倍数,对所述目标多边形进行放大,并基于放大后的目标多边形,预估所述文本的目标尺寸;基于所述放大后的目标多边形以及所述目标尺寸,确定透视变换矩阵;基于所述透视变换矩阵,对所述文本图像进行透视变换,得到所述目标图像。4.根据权利要求3所述的方法,其特征在于,所述基于所述放大后的目标多边形以及所述目标尺寸,确定透视变换矩阵,包括:获取所述放大后的目标多边形在所述文本图像的图像坐标系的第一顶点位置;获取所述目标尺寸的区域在所述图像坐标系的第二顶点位置;基于所述第一顶点位置和所述第二顶点位置,确定所述透视变换矩阵。5.根据权利要求1所述的方法,其特征在于,所述边缘图和分割图是通过目标模型获取,所述目标模型的训练方式,包括:通过初始模型,提取样本图像的样本边缘图和样本分割图,所述样本图像的真值标签包括所述样本图像的真值边缘图和真值分割图;基于第一平衡参数和边缘提升参数,确定所述样本边缘图和所述真值边缘图之间的第一差异,所述第一平衡参数用于平衡所述样本图像中边缘位置与非边缘位置之间的比例,所述边缘提升参数用于增大所述第一差异中边缘位置差异的比重,所述边缘位置差异是指所述样本边缘图中预测边缘位置和所述真值边缘图中边缘位置之间的差异;基于第二平衡参数,确定所述样本分割图与所述真值分割图之间的第二差异,所述第二平衡参数用于平衡所述样本图像中文本区域与非文本区域之间的比例;基于所述第一差异和所述第二差异,对所述初始模型进行训练,得到所述目标模型。6.根据权利要求5所述的方法,其特征在于,所述基于第一平衡参...
【专利技术属性】
技术研发人员:林庆祥,郭春超,王红法,刘威,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。