垂直文本行识别方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:29286391 阅读:11 留言:0更新日期:2021-07-16 23:58
本公开提供一种垂直文本行识别方法、装置、设备及计算机可读存储介质,方法包括:获取待识别垂直文本行;将待识别垂直文本行向预设的第一方向旋转预设的角度,获得旋转后的待识别垂直文本行;通过预设的文本分割模型对旋转后的待识别垂直文本行进行分割操作,获得至少两个旋转后的文字;将至少两个旋转后的文字向预设的第二方向进行旋转预设的角度,获得至少两个水平方向的文字,第一方向与第二方向相反;对至少两个水平方向的文字进行拼接操作,获得水平方向的待识别垂直文本行,对水平方向的待识别垂直文本行进行识别操作。从而能够采用现有的任意一种文字识别模型对其进行识别,提高垂直文本行的识别率,也能够提高文字识别模型的适用度。模型的适用度。模型的适用度。

Vertical text line recognition method, device, device and computer readable storage medium

【技术实现步骤摘要】
垂直文本行识别方法、装置、设备及计算机可读存储介质


[0001]本公开涉及图像处理领域,尤其涉及一种垂直文本行识别方法、装置、设备及计算机可读存储介质。

技术介绍

[0002]由于实际应用中,很多图像中都包括文字信息,因此,对图像信息的文字识别应用在了越来越多的场景中。以短视频应用软件举例来说,当用户上传视频信息之后,该视频信息中可能包括文字信息,需要对该文字信息进行识别,以确定该视频是否包含违法信息,或者,可以根据文字信息对该视频进行分类等操作。
[0003]为了实现对图像中文字信息的识别,现有技术中一般都是使用OCR模型进行识别。但是,由于用户的书写以及阅读习惯,一般OCR模型的训练文本都是水平的文本行,而垂直方向的文本行训练文本较少。相应地,上述方法仅能够对水平文本行进行精准识别,其无法对垂直文本行进行识别,识别目标较为单一,适用性不强。

技术实现思路

[0004]本公开提供一种垂直文本行识别方法、装置、设备及计算机可读存储介质,用于解决现有的文字信息识别方法无法对垂直文本行进行识别,识别目标较为单一、适用性不强的技术问题。
[0005]本公开的第一个方面是提供一种垂直文本行识别方法,包括:
[0006]获取待识别垂直文本行,其中,所述待识别垂直文本行中文字的阅读方向垂直与水平方向;
[0007]将所述待识别垂直文本行向预设的第一方向旋转预设的角度,获得旋转后的待识别垂直文本行;
[0008]通过预设的文本分割模型对所述旋转后的待识别垂直文本行进行分割操作,获得至少两个旋转后的文字;
[0009]将所述至少两个旋转后的文字向预设的第二方向进行旋转预设的角度,获得至少两个水平方向的文字,其中,所述第一方向与所述第二方向相反;
[0010]对所述至少两个水平方向的文字进行拼接操作,获得水平方向的待识别垂直文本行,对所述水平方向的待识别垂直文本行进行识别操作。
[0011]本公开的第二个方面是提供一种垂直文本行识别装置,包括:
[0012]获取模块,用于获取待识别垂直文本行,其中,所述待识别垂直文本行中文字的阅读方向垂直与水平方向;
[0013]旋转模块,用于将所述待识别垂直文本行向预设的第一方向旋转预设的角度,获得旋转后的待识别垂直文本行;
[0014]分割模块,用于通过预设的文本分割模型对所述旋转后的待识别垂直文本行进行分割操作,获得至少两个旋转后的文字;
[0015]旋转模块,用于将所述至少两个旋转后的文字向预设的第二方向进行旋转预设的角度,获得至少两个水平方向的文字,其中,所述第一方向与所述第二方向相反;
[0016]识别模块,用于对所述至少两个水平方向的文字进行拼接操作,获得水平方向的待识别垂直文本行,对所述水平方向的待识别垂直文本行进行识别操作。
[0017]本公开的第三个方面是提供一种垂直文本行识别设备,包括:存储器,处理器;
[0018]存储器;用于存储所述处理器可执行指令的存储器;
[0019]其中,所述处理器被配置为由所述处理器执行如第一方面所述的垂直文本行识别方法。
[0020]本公开的第四个方面是提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如第一方面所述的垂直文本行识别方法。
[0021]本公开提供的垂直文本行识别方法、装置、设备及计算机可读存储介质,通过将待识别垂直文本行进行旋转操作,将其转换为水平方向的待识别垂直文本行,从而能够采用现有的任意一种文字识别模型对其进行识别,提高垂直文本行的识别率,也能够提高文字识别模型的适用度。
附图说明
[0022]为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
[0023]图1为本公开实施例一提供的垂直文本行识别方法的流程示意图;
[0024]图2为本公开实施例提供的文本行示意图;
[0025]图3为本公开实施例提供的垂直文本行旋转示意图;
[0026]图4为本公开实施例提供的文字旋转示意图;
[0027]图5为本公开实施例提供的应用场景示意图;
[0028]图6为本公开实施例二提供的垂直文本行识别方法的流程示意图;
[0029]图7为本公开实施例三提供的垂直文本行识别装置的结构示意图;
[0030]图8为本公开实施例四提供的垂直文本行识别设备的结构示意图。
具体实施方式
[0031]为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例所获得的所有其他实施例,都属于本公开保护的范围。
[0032]针对上述提及的在现有的文字识别方法中,一般采用OCR模型对包含文本信息的图像进行识别,但是,OCR模型的训练文本中垂直文本行较少,因此无法对垂直文本行进行精准识别的技术问题,本公开提供了一种垂直文本行识别方法、装置、设备及计算机可读存储介质,其能够预先将垂直文本行转换为水平文本行,对水平文本行进行文字识别操作,能够大大地提高垂直文本行的识别精准度,提高OCR模型的适用性。
[0033]需要说明的是,本公开提供的垂直文本行识别方法、装置、设备及计算机可读存储介质能够应用在任意一种对文字进行识别的场景中。
[0034]本公开基于的网络架构至少包括:数据服务器、垂直文本行识别装置。其中,垂直文本行识别装置采用C/C++、Java、Shell或Python等语言编写;数据服务器中存储有大量的数据。数据服务器与垂直文本行识别装置通信连接。
[0035]图1为本公开实施例一提供的垂直文本行识别方法的流程示意图,如图1所示,所述方法包括:
[0036]步骤101、获取待识别垂直文本行,其中,所述待识别垂直文本行中文字的阅读方向垂直与水平方向。
[0037]本实施例的执行主体为垂直文本行识别装置。水平文本行即为文字阅读方向平行于水平线的文本行,相应地,垂直文本行即为文字阅读方向垂直于水平线的文本行,其可以包括阅读方向与水平线呈90
°
以及-90
°
的文本行。图2为本公开实施例提供的文本行示意图,如图2所示,“水平文本行”中文字的阅读方向为从左到右,平行与水平线,“垂直文本行”中文字的阅读方向为从上到下,垂直与水平线。
[0038]由于目前的OCR模型只能够对水平文本行进行精准的识别,因此,针对垂直文本行,则可以预先将其转换为水平文本行,再通过OCR模型对该转换后的水平文本行进行识别,从而能够实现对垂直文本行的精准识别。因此,首先需要获取待识别垂直文本行。以短视频应用软件本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种垂直文本行识别方法,其特征在于,包括:获取待识别垂直文本行,其中,所述待识别垂直文本行中文字的阅读方向垂直与水平方向;将所述待识别垂直文本行向预设的第一方向旋转预设的角度,获得旋转后的待识别垂直文本行;通过预设的文本分割模型对所述旋转后的待识别垂直文本行进行分割操作,获得至少两个旋转后的文字;将所述至少两个旋转后的文字向预设的第二方向进行旋转预设的角度,获得至少两个水平方向的文字,其中,所述第一方向与所述第二方向相反;对所述至少两个水平方向的文字进行拼接操作,获得水平方向的待识别垂直文本行,对所述水平方向的待识别垂直文本行进行识别操作。2.根据权利要求1所述的方法,其特征在于,所述获取待识别垂直文本行,包括:获取待处理图像,确定所述待处理图像中的目标文本;通过预设的网络模型确定所述目标文本中的待识别垂直文本行;或,通过预设的标注信息确定所述目标文本中的待识别垂直文本行。3.根据权利要求2所述的方法,其特征在于,所述通过预设的网络模型确定所述目标文本中的待识别垂直文本行,包括:将所述目标文本输入至预设的网络模型中,获得所述目标文本对应的第一置信度,所述置信度用于表征所述目标文本的阅读方向与所述水平方向之间的角度;若所述第一置信度低于预设的阈值,则将所述目标文本旋转预设的角度,获得旋转后的目标文本;将所述旋转后的目标文本输入至所述网络模型中,获得所述目标文本对应的第二置信度;若所述第二置信度低于预设的阈值,则将所述目标文本作为所述待识别垂直文本行。4.根据权利要求2所述的方法,其特征在于,所述通过预设的标注信息确定所述目标文本中的待识别垂直文本行,包括:确定所述目标文本对应的标注信息,所述标注信息用于表征所述目标文本中文字的阅读方向;若所述标注信息表征所述目标文本中文字的阅读方向垂直与水平方向,则将所述目标文本作为所述待识别垂直文本行。5.根据权利要求1-4任一项所述的方法...

【专利技术属性】
技术研发人员:卢永晨
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1