【技术实现步骤摘要】
一种基于深度学习的两阶段斜体字符识别方法及装置
[0001]本申请涉及斜体字识别领域,尤其涉及一种基于深度学习的两阶段斜体字符识别方法及装置。
技术介绍
[0002]深度学习是机器学习的一种,是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。字符识别,是指对已分割出的文字区域进行识别文字内容。斜体字符是在正常字体样式基础上,通过倾斜字体实现的一种字体样式。
[0003]然而,在文本中包含字符为斜体字符的场景下,现有模型无法直接识别斜体字符,导致了斜体字符识别失败。
技术实现思路
[0004]为了解决由于字符识别时无法直接识别斜体字符,而导致斜体字符识别失败的问题,本申请提供了一种基于深度学习的两阶段斜体字符识别方法及装置。
[0005]为了解决上述技术问题,本申请实施例公开了如下技术方案:
[0006]第一方面,本申请实施例公开了一种基于深度学习的两阶段斜体字符识别方法,包括:
[0007]对待检测文本进行特征提取,获取 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度学习的两阶段斜体字符识别方法,其特征在于,包括:对待检测文本进行特征提取,获取第一特征图,所述第一特征图为第一预设通道的预设尺度的特征图;根据设定置信度范围,获取所述第一特征图中第一个通道的文本区域、及剩余通道的坐标区域;基于密集预测,根据所述文本区域和所述坐标区域中每个像素的横、纵坐标,获取文本框顶点的横、纵坐标,所述文本框为所述文本区域的最小面积外接四边形;根据所述文本框顶点的横、纵坐标、设定的矫正后所述文本框高度,对所述文本区域进行透视变换裁剪,获取矫正后的所述文本区域的图像;对矫正后的所述文本区域的图像进行特征提取,获取第二特征图,对所述第二特征图宽度上的序列信息建模,以识别矫正后的所述文本区域的图像中正体字符,矫正后的所述文本区域的图像为包含正体字符的图像。2.根据权利要求1所述的基于深度学习的两阶段斜体字符识别方法,其特征在于,在所述对待检测文本进行特征提取,获取第一特征图,所述第一特征图为第一预设通道的预设尺度的特征图的步骤中,所述方法包括:对待检测文本进行多尺度的特征提取,获得多尺度的特征图,根据所述多尺度的特征图,获得上采样、逐元素相加、卷积平滑处理后的多尺度的特征图,所述多尺度的特征图包括预设尺度的特征图;根据上采样、逐元素相加、卷积平滑处理后的预设尺度的特征图,获得第一特征图,所述第一特征图为第一预设通道的预设尺度的特征图。3.根据权利要求1所述的基于深度学习的两阶段斜体字符识别方法,其特征在于,所述第一预设通道的预设尺度的特征图为9通道的1/4尺度特征图。4.根据权利要求1所述的基于深度学习的两阶段斜体字符识别方法,其特征在于,所述置信度范围为像素值范围。5.根据权利要求1所述的基于深度学习的两阶段斜体字符识别方法,其特征在于,在所述基于密集预测,根据所述文本区域和所述坐标区域中每个像素的横、纵坐标,获取文本框顶点的横、纵坐标,所述文本框为所述文本区域的最小面积外接四边形的步骤中,所述方法包括:基于密集预测,根据文本区域中每个像素的横、纵坐标,分别获取坐标区域相应像素的横、纵坐标,作为文本框的一组顶点横、纵坐标,对所述文本框的多组顶点横、纵坐标进行NMS过滤,获取文本框顶点的横、纵坐标,所述文本框为所述文本区域的最小面积外接四边形。6.根据权利要求1所述的基于深度学习的两阶段斜体字符识别方法,其特征在于,在根据所述文本框顶点的横、纵坐标、设定的矫正后所述文本框高度,对所述文本区域进行透视变换裁剪,获取矫正后的所述文本区域的图像的步骤中,所述方法包括:根据文本框顶点的横、纵坐标、及设定的所述文本框矫正后的高度,获得矫正后的所述文本框顶点的横、纵坐标,根据所述文本框顶点的横、纵坐标和矫正后的所述文本框顶点的横、纵...
【专利技术属性】
技术研发人员:王博帝,彭斌,杨艺,
申请(专利权)人:深圳市凌云视迅科技有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。