一种文本行方向确定方法及其相关设备技术

技术编号:29491098 阅读:15 留言:0更新日期:2021-07-30 19:03
本申请公开了一种文本行方向确定方法及其相关设备,在获取到待处理图像之后,先确定该待处理图像中待处理文本行的全局区域和该待处理文本行的局部区域,以使该待处理文本行的全局区域表示该待处理文本行在该待处理图像内所占区域,以及该待处理文本行的局部区域表示该待处理文本行的预设部分在该待处理图像内所占区域;再将该待处理文本行的全局区域与该待处理文本行的局部区域进行位置比较,得到该待处理文本行的文本行方向。如此能够实现准确地确定出图像中文本行的文本行方向,从而有利于提高图像中文本行的字符识别准确性。

【技术实现步骤摘要】
一种文本行方向确定方法及其相关设备
本申请涉及图像处理
,尤其涉及一种文本行方向确定方法及其相关设备。
技术介绍
字符识别(如,光学字符识别)是指对图像中字符进行识别处理,以获取该图像中携带的文字信息。实际上,图像中文本行可以按照任一方向(例如,顺时针旋转90°等)进行呈现,故为了提高字符识别的准确性,可以在对图像中文本行(尤其是,具有一定旋转角度的文本行)进行字符识别时参考该文本行的文本行方向。其中,文本行方向是指一个文本行在图像中呈现的旋转信息。然而,如何确定文本行方向成为一项亟待解决的技术问题。
技术实现思路
为了解决现有技术中存在的以上技术问题,本申请提供一种文本行方向确定方法及其相关设备,能够准确地确定出图像中文本行的文本行方向,如此有利于提高图像中文本行的字符识别准确性。为了实现上述目的,本申请实施例提供的技术方案如下:本申请实施例提供一种文本行方向确定方法,所述方法包括:获取待处理图像;确定所述待处理图像中待处理文本行的全局区域和所述待处理文本行的局部区域;其中,所述待处理文本行的全局区域表示所述待处理文本行在所述待处理图像内所占区域;所述待处理文本行的局部区域表示所述待处理文本行的预设部分在所述待处理图像内所占区域;将所述待处理文本行的全局区域与所述待处理文本行的局部区域进行位置比较,得到所述待处理文本行的文本行方向。本申请实施例还提供了一种文本行方向确定装置,所述装置包括:图像获取单元,用于获取待处理图像;区域确定单元,用于确定所述待处理图像中待处理文本行的全局区域和所述待处理文本行的局部区域;其中,所述待处理文本行的全局区域表示所述待处理文本行在所述待处理图像内所占区域;所述待处理文本行的局部区域表示所述待处理文本行的预设部分在所述待处理图像内所占区域;方向确定单元,用于将所述待处理文本行的全局区域与所述待处理文本行的局部区域进行位置比较,得到所述待处理文本行的文本行方向。本申请实施例还提供了一种设备,所述设备包括处理器以及存储器:所述存储器用于存储计算机程序;所述处理器用于根据所述计算机程序执行本申请实施例提供的文本行方向确定方法的任一实施方式。本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行本申请实施例提供的文本行方向确定方法的任一实施方式。本申请实施例还提供了一种计算机程序产品,所述计算机程序产品在终端设备上运行时,使得所述终端设备执行本申请实施例提供的文本行方向确定方法的任一实施方式。与现有技术相比,本申请实施例至少具有以下优点:本申请实施例提供的文本行方向确定方法及其相关设备中,在获取到待处理图像之后,先确定该待处理图像中待处理文本行的全局区域和该待处理文本行的局部区域,以使该待处理文本行的全局区域表示该待处理文本行在该待处理图像内所占区域,以及该待处理文本行的局部区域表示该待处理文本行的预设部分在该待处理图像内所占区域;再将该待处理文本行的全局区域与该待处理文本行的局部区域进行位置比较,得到该待处理文本行的文本行方向。其中,因待处理文本行的全局区域以及局部区域分别能够表示该待处理文本行在待处理图像内所占区域以及该待处理文本行的预设部分在待处理图像内所占区域,使得该待处理文本行的全局区域以及局部区域能够综合表示出该待处理文本行在待处理图像中的呈现方式,从而使得基于待处理文本行的全局区域以及局部区域确定出的该待处理文本行的文本行方向能够准确地描述出该待处理文本行在待处理图像中的呈现方式,如此能够实现准确地确定出图像中文本行的文本行方向,从而有利于提高图像中文本行的字符识别准确性。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1为本申请实施例提供的一种图像、其对应的全局区域以及其对应的局部区域的示意图;图2为本申请实施例提供的一种原图、其对应的全局掩码图以及局部掩码图的示意图;图3为本申请实施例提供的一种文本行方向确定方法的流程图;图4为本申请实施例提供的一种有向连接的示意图;图5为本申请实施例提供的一种横向文本行的旋转方式的特征示意图;图6为本申请实施例提供的一种竖直文本行的旋转方式的特征示意图;图7为本申请实施例提供的另一种横向文本行的旋转方式的特征示意图;图8为本申请实施例提供的另一种竖直文本行的旋转方式的特征示意图;图9为本申请实施例提供的一种文本行方向确定装置的结构示意图。具体实施方式专利技术人在针对文本行方向的研究中发现,对于图像中的一个文本行来说,在该文本行在该图像中按照不同的文本行方向进行呈现时,该文本行在该图像内所占区域(如图1所示的全局区域)和该文本行的预设部分(如,首字符或者各个字符的预设局部区域)在该图像内所占区域(如图1所示的首字符区域或者字符串局部区域)将按照不同的相对关系进行呈现(如图2所示)。需要说明的是,在图2中,“文本行-1”是按照正方向(也就是旋转角度为0°)进行呈现的横向文本行;“文本行-2”是按照逆时针旋转第一角度进行呈现的横向文本行,且该第一角度介于0°到90°之间;“文本行-3”是按照顺时针旋转180°或者按照逆时针旋转180°进行呈现的横向文本行;“文本行-4”是按照顺时针旋转90°进行呈现的横向文本行;“文本行-5”是按照逆时针旋转90°进行呈现的横向文本行;“文本行-6”是按照正方向(也就是旋转角度为0°)进行呈现的竖直文本行;“文本行-7”是按照顺时针旋转180°或者按照逆时针旋转180°进行呈现的竖直文本行。其中,横向文本行的文字排列方式为横排;且竖直文本行的文字排列方式为竖排。基于上述发现,本申请实施例提供了一种文本行方向确定方法,该方法可以包括:获取待处理图像;确定该待处理图像中待处理文本行的全局区域和该待处理文本行的局部区域;将该待处理文本行的全局区域与该待处理文本行的局部区域进行位置比较,得到该待处理文本行的文本行方向。其中,因待处理文本行的全局区域以及局部区域分别能够表示该待处理文本行在该待处理图像内所占区域以及该待处理文本行的预设部分在该待处理图像内所占区域,使得该待处理文本行的全局区域以及局部区域能够综合表示出该待处理文本行在待处理图像中的呈现方式,从而使得基于待处理文本行的全局区域以及局部区域确定出的该待处理文本行的文本行方向能够准确地描述出该待处理文本行在待处理图像中的呈现方式,如此能够实现准确地确定出图像中文本行的文本行方向,从而有利于提高图像中文本行的字符识别准确性。另外,本申请实施例不限定文本行方向确定方法的执行主体,例如,本申请实施例提供的文本行方向确定方法可以应用于终端设本文档来自技高网...

【技术保护点】
1.一种文本行方向确定方法,其特征在于,所述方法包括:/n获取待处理图像;/n确定所述待处理图像中待处理文本行的全局区域和所述待处理文本行的局部区域;其中,所述待处理文本行的全局区域表示所述待处理文本行在所述待处理图像内所占区域;所述待处理文本行的局部区域表示所述待处理文本行的预设部分在所述待处理图像内所占区域;/n将所述待处理文本行的全局区域与所述待处理文本行的局部区域进行位置比较,得到所述待处理文本行的文本行方向。/n

【技术特征摘要】
1.一种文本行方向确定方法,其特征在于,所述方法包括:
获取待处理图像;
确定所述待处理图像中待处理文本行的全局区域和所述待处理文本行的局部区域;其中,所述待处理文本行的全局区域表示所述待处理文本行在所述待处理图像内所占区域;所述待处理文本行的局部区域表示所述待处理文本行的预设部分在所述待处理图像内所占区域;
将所述待处理文本行的全局区域与所述待处理文本行的局部区域进行位置比较,得到所述待处理文本行的文本行方向。


2.根据权利要求1所述的方法,其特征在于,所述待处理文本行的全局区域和所述待处理文本行的局部区域的确定过程,包括:
将所述待处理图像输入预先构建的掩码图生成模型,得到所述掩码图生成模型输出的所述待处理图像对应的预测文本行全局掩码图和所述待处理图像对应的预测文本行局部掩码图;其中,所述掩码图生成模型是根据样本图像、所述样本图像对应的实际文本行全局掩码图和所述样本图像对应的实际文本行局部掩码图构建的;所述待处理图像对应的预测文本行全局掩码图包括所述待处理文本行对应的全局掩码区域;所述待处理图像对应的预测文本行局部掩码图包括所述待处理文本行对应的局部掩码区域;
将所述待处理图像对应的预测文本行全局掩码图中所述待处理文本行对应的全局掩码区域,确定为所述待处理文本行的全局区域;
将所述待处理图像对应的预测文本行局部掩码图中所述待处理文本行对应的局部掩码区域,确定为所述待处理文本行的局部区域。


3.根据权利要求1所述的方法,其特征在于,所述待处理文本行的局部区域包括所述待处理文本行的首字符区域。


4.根据权利要求3所述的方法,其特征在于,所述将所述待处理文本行的全局区域与所述待处理文本行的局部区域进行位置比较,得到所述待处理文本行的文本行方向,包括:
根据所述待处理文本行的全局区域中心和所述待处理文本行的首字符区域中心之间的相对位置信息,确定所述待处理文本行的文本行方向;其中,所述待处理文本行的全局区域中心表示所述待处理文本行的全局区域的中心位置;所述待处理文本行的首字符区域中心表示所述待处理文本行的首字符区域的中心位置。


5.根据权利要求4所述的方法,其特征在于,所述文本行方向包括文本行旋转方向和/或文本行旋转角度;
所述待处理文本行的文本行旋转方向的确定过程,包括:
根据所述待处理文本行的全局区域中心和所述待处理文本行的首字符区域中心之间在第一预设方向上的相对关系,确定所述待处理文本行的第一旋转方向;根据所述待处理文本行的第一旋转方向,确定所述待处理文本行的文本行旋转方向;
所述待处理文本行的文本行旋转角度的确定过程,包括:
对所述待处理文本行的全局区域中心和所述待处理文本行的首字符区域中心进行有向连接,得到第一向量;将所述第一向量与第一预设向量之间的夹角,确定为所述待处理文本行的第一旋转角度;根据所述待处理文本行的第一旋转角度,确定所述待处理文本行的文本行旋转角度。


6.根据权利要求1所述的方法,其特征在于,所述待处理文本行的局部区域包括所述待处理文本行的首字符区域和所述待处理文本行的字符串局部区域;其中,所述待处理文本行的字符串局部区域是由所述待处理文本行中各个字符的预设局部区域进行连接得到的。


7.根据权利要求6所述的方法,其特征在于,所述将所述待处理文本行的全局区域与所述待处理文本行的局部区域进行位置比较,得到所述待处理文本行的文本行方向,包括:
根据所述待处理文本行的全局区域中心、所述待处理文本行的首字符区域中心和所述待处理文本行的字符串局部区域中心中至少两个之间的相对位置信息,确定所述待处理文本行的文本行方向;其中,所述待处理文本行的全局区域中心表示所述待处理文本行的全局区域的中心位置;所述待处理文本行的首字符区域中心表示所述待处理文本行的首字符区域的中心位置;所述待处理文本行的字符串局部区域中心表示所述待处理文本行的字符串局部区域的中心位置。


8.根据权利要求7所述的方法,其特征在于,所述文本行方向包括文本行旋转方式和/或文字排列方式;
所述待处...

【专利技术属性】
技术研发人员:石威林丽黄灿王长虎
申请(专利权)人:北京有竹居网络技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1