【技术实现步骤摘要】
一种文本行方向确定方法及其相关设备
本申请涉及图像处理
,尤其涉及一种文本行方向确定方法及其相关设备。
技术介绍
字符识别(如,光学字符识别)是指对图像中字符进行识别处理,以获取该图像中携带的文字信息。实际上,图像中文本行可以按照任一方向(例如,顺时针旋转90°等)进行呈现,故为了提高字符识别的准确性,可以在对图像中文本行(尤其是,具有一定旋转角度的文本行)进行字符识别时参考该文本行的文本行方向。其中,文本行方向是指一个文本行在图像中呈现的旋转信息。然而,如何确定文本行方向成为一项亟待解决的技术问题。
技术实现思路
为了解决现有技术中存在的以上技术问题,本申请提供一种文本行方向确定方法及其相关设备,能够准确地确定出图像中文本行的文本行方向,如此有利于提高图像中文本行的字符识别准确性。为了实现上述目的,本申请实施例提供的技术方案如下:本申请实施例提供一种文本行方向确定方法,所述方法包括:获取待处理图像;确定所述待处理图像中待处理文本行的全局区域和所述待处理文本行的局部区域;其中,所述待处理文本行的全局区域表示所述待处理文本行在所述待处理图像内所占区域;所述待处理文本行的局部区域表示所述待处理文本行的预设部分在所述待处理图像内所占区域;将所述待处理文本行的全局区域与所述待处理文本行的局部区域进行位置比较,得到所述待处理文本行的文本行方向。本申请实施例还提供了一种文本行方向确定装置,所述装置包括:图像获取单元,用于获取待处理图像;区域确定单元 ...
【技术保护点】
1.一种文本行方向确定方法,其特征在于,所述方法包括:/n获取待处理图像;/n确定所述待处理图像中待处理文本行的全局区域和所述待处理文本行的局部区域;其中,所述待处理文本行的全局区域表示所述待处理文本行在所述待处理图像内所占区域;所述待处理文本行的局部区域表示所述待处理文本行的预设部分在所述待处理图像内所占区域;/n将所述待处理文本行的全局区域与所述待处理文本行的局部区域进行位置比较,得到所述待处理文本行的文本行方向。/n
【技术特征摘要】
1.一种文本行方向确定方法,其特征在于,所述方法包括:
获取待处理图像;
确定所述待处理图像中待处理文本行的全局区域和所述待处理文本行的局部区域;其中,所述待处理文本行的全局区域表示所述待处理文本行在所述待处理图像内所占区域;所述待处理文本行的局部区域表示所述待处理文本行的预设部分在所述待处理图像内所占区域;
将所述待处理文本行的全局区域与所述待处理文本行的局部区域进行位置比较,得到所述待处理文本行的文本行方向。
2.根据权利要求1所述的方法,其特征在于,所述待处理文本行的全局区域和所述待处理文本行的局部区域的确定过程,包括:
将所述待处理图像输入预先构建的掩码图生成模型,得到所述掩码图生成模型输出的所述待处理图像对应的预测文本行全局掩码图和所述待处理图像对应的预测文本行局部掩码图;其中,所述掩码图生成模型是根据样本图像、所述样本图像对应的实际文本行全局掩码图和所述样本图像对应的实际文本行局部掩码图构建的;所述待处理图像对应的预测文本行全局掩码图包括所述待处理文本行对应的全局掩码区域;所述待处理图像对应的预测文本行局部掩码图包括所述待处理文本行对应的局部掩码区域;
将所述待处理图像对应的预测文本行全局掩码图中所述待处理文本行对应的全局掩码区域,确定为所述待处理文本行的全局区域;
将所述待处理图像对应的预测文本行局部掩码图中所述待处理文本行对应的局部掩码区域,确定为所述待处理文本行的局部区域。
3.根据权利要求1所述的方法,其特征在于,所述待处理文本行的局部区域包括所述待处理文本行的首字符区域。
4.根据权利要求3所述的方法,其特征在于,所述将所述待处理文本行的全局区域与所述待处理文本行的局部区域进行位置比较,得到所述待处理文本行的文本行方向,包括:
根据所述待处理文本行的全局区域中心和所述待处理文本行的首字符区域中心之间的相对位置信息,确定所述待处理文本行的文本行方向;其中,所述待处理文本行的全局区域中心表示所述待处理文本行的全局区域的中心位置;所述待处理文本行的首字符区域中心表示所述待处理文本行的首字符区域的中心位置。
5.根据权利要求4所述的方法,其特征在于,所述文本行方向包括文本行旋转方向和/或文本行旋转角度;
所述待处理文本行的文本行旋转方向的确定过程,包括:
根据所述待处理文本行的全局区域中心和所述待处理文本行的首字符区域中心之间在第一预设方向上的相对关系,确定所述待处理文本行的第一旋转方向;根据所述待处理文本行的第一旋转方向,确定所述待处理文本行的文本行旋转方向;
所述待处理文本行的文本行旋转角度的确定过程,包括:
对所述待处理文本行的全局区域中心和所述待处理文本行的首字符区域中心进行有向连接,得到第一向量;将所述第一向量与第一预设向量之间的夹角,确定为所述待处理文本行的第一旋转角度;根据所述待处理文本行的第一旋转角度,确定所述待处理文本行的文本行旋转角度。
6.根据权利要求1所述的方法,其特征在于,所述待处理文本行的局部区域包括所述待处理文本行的首字符区域和所述待处理文本行的字符串局部区域;其中,所述待处理文本行的字符串局部区域是由所述待处理文本行中各个字符的预设局部区域进行连接得到的。
7.根据权利要求6所述的方法,其特征在于,所述将所述待处理文本行的全局区域与所述待处理文本行的局部区域进行位置比较,得到所述待处理文本行的文本行方向,包括:
根据所述待处理文本行的全局区域中心、所述待处理文本行的首字符区域中心和所述待处理文本行的字符串局部区域中心中至少两个之间的相对位置信息,确定所述待处理文本行的文本行方向;其中,所述待处理文本行的全局区域中心表示所述待处理文本行的全局区域的中心位置;所述待处理文本行的首字符区域中心表示所述待处理文本行的首字符区域的中心位置;所述待处理文本行的字符串局部区域中心表示所述待处理文本行的字符串局部区域的中心位置。
8.根据权利要求7所述的方法,其特征在于,所述文本行方向包括文本行旋转方式和/或文字排列方式;
所述待处...
【专利技术属性】
技术研发人员:石威,林丽,黄灿,王长虎,
申请(专利权)人:北京有竹居网络技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。