文字行检测的方法、装置、电子设备及存储介质制造方法及图纸

技术编号:35607367 阅读:15 留言:0更新日期:2022-11-16 15:30
本申请属于文本检测技术领域,公开了文字行检测的方法、装置、电子设备及存储介质,该方法包括,对待处理的原始图像进行文字行检测,获得第一文本检测框;确定第一文本检测框的文本旋转角度;根据文本旋转角度,对原始图像中的文本内容进行旋转矫正,获得文本旋转图像;对文本旋转图像进行文字行检测,获得第二文本检测框;根据文本旋转角度,对第二文本检测框及其包含的文本内容进行逆旋转,获得检测框图像。这样,解决了存在旋转文本的原始图像的文本行检测效果不佳的问题,提高了文本检测框的质量。质量。质量。

【技术实现步骤摘要】
文字行检测的方法、装置、电子设备及存储介质


[0001]本申请涉及文本检测
,具体而言,涉及文字行检测的方法、装置、电子设备及存储介质。

技术介绍

[0002]在对图像进行文本检测并识别时,通常需要先对图像进行文字行检测,获得文本检测框,然后对文本检测框内的文本内容进行识别,获得文本识别结果。其中,文本检测框为图像中文本区域的外接框,外接框通常为外接矩形框。
[0003]在文字行检测过程中,若图像中的文本内容处于横平竖直的状态(即文本内容与水平线平行),则可以获得仅包含某一行文本内容的文本检测框。
[0004]但是,实际应用中,图像中的文本内容可能存在一定角度的旋转,即文本内容处于非横平竖直的状态。在对存在旋转文本的图像进行文字行检测时,获得的文本检测框通常存在各种问题,文本检测框的质量较差。例如,本检测框中可能包含多行文本内容,文本检测框与文本内容之间可能存在较大的空隙,以及,可能存在未被文本检测框包含的文字,显然,这会使得后续基于文本检测框的文本识别的准确度较低。

技术实现思路

[0005]本申请实施例的目的在于提供文字行检测的方法、装置、电子设备及存储介质,用以在对存在旋转文本的图像进行文字行检测时,提高文本检测框的质量,进而提高基于文本检测框的文本识别准确率。
[0006]一方面,提供一种文字行检测的方法,包括:
[0007]对待处理的原始图像进行文字行检测,获得第一文本检测框;
[0008]确定第一文本检测框的文本旋转角度;
[0009]根据文本旋转角度,对原始图像中的文本内容进行旋转矫正,获得文本旋转图像;
[0010]对文本旋转图像进行文字行检测,获得第二文本检测框;
[0011]根据文本旋转角度,对第二文本检测框及其包含的文本内容进行逆旋转,获得检测框图像。
[0012]在上述实现过程中,先对原始图像中的文本内容进行旋转矫正之后,再进行文本行检测以及逆旋转,解决了存在旋转文本(即存在一定角度的旋转文本)的原始图像的文本行检测效果不佳的问题,提高了文本检测框的质量,使得文本检测框紧贴文字行,且避免了同一文本检测框包含多行文本内容以及漏字的问题。
[0013]一种实施方式中,确定第一文本检测框的文本旋转角度,包括:
[0014]确定第一文本检测框的上下边界线与水平线之间的角度,获得文本旋转角度;上下边界线为第一文本检测框上侧的边界线或下侧的边界线;
[0015]或者,确定第一文本检测框的左右边界线与垂直线之间的角度,获得文本旋转角度;左右边界线为第一文本检测框左侧的边界线或右侧的边界线。
[0016]在上述实现过程中,可以确定第一文本检测框的文本旋转角度,从而确定了文本内容的文本旋转角度。
[0017]一种实施方式中,根据文本旋转角度,对原始图像中的文本内容进行旋转矫正,包括:
[0018]若确定文本旋转角度不高于文本旋转角度阈值,则将原始图像确定为文本旋转图像;
[0019]若确定文本旋转角度高于文本旋转角度阈值,则将原始图像中的文本内容,按照指定旋转方向旋转文本旋转角度,获得文本旋转图像。
[0020]在上述实现过程中,文本旋转角度较小的原始图像可以不进行旋转矫正,从而在保证文本检测框的效果的同时,减少了数据处理量。
[0021]一种实施方式中,将原始图像中的文本内容,按照指定旋转方向旋转文本旋转角度,获得文本旋转图像,包括:
[0022]根据文本旋转角度以及指定旋转方向,生成仿射变换矩阵;
[0023]基于仿射变换矩阵,对原始图像进行仿真变换,获得文本旋转图像。
[0024]在上述实现过程中,采用了仿射变换的方式进行文本内容的旋转。
[0025]一种实施方式中,根据文本旋转角度,对原始图像中的文本内容进行旋转矫正,包括:
[0026]若文本旋转角度为多个且各文本旋转角度符合设定平均条件,则确定各文本旋转角度的平均值;按照平均值,旋转矫正原始图像中的文本内容;
[0027]若文本旋转角度为多个且各文本旋转角度符合设定差值条件,则根据各第一文本检测框的文本旋转角度对各自包含的文本内容进行旋转矫正。
[0028]在上述实现过程中,在存在多个第一文本检测框时,可以对各文本旋转角度进行平均处理后旋转矫正或者针对各文本旋转角度分别进行旋转矫正。
[0029]一方面,提供一种文字行检测的装置,包括:
[0030]第一检测单元,用于对待处理的原始图像进行文字行检测,获得第一文本检测框;
[0031]确定单元,用于确定第一文本检测框的文本旋转角度;
[0032]旋转单元,用于根据文本旋转角度,对原始图像中的文本内容进行旋转矫正,获得文本旋转图像;
[0033]第二检测单元,用于对文本旋转图像进行文字行检测,获得第二文本检测框;
[0034]获得单元,用于根据文本旋转角度,对第二文本检测框及其包含的文本内容进行逆旋转,获得检测框图像。
[0035]一种实施方式中,确定单元用于:
[0036]确定第一文本检测框的上下边界线与水平线之间的角度,获得文本旋转角度;上下边界线为第一文本检测框上侧的边界线或下侧的边界线;
[0037]或者,确定第一文本检测框的左右边界线与垂直线之间的角度,获得文本旋转角度;左右边界线为第一文本检测框左侧的边界线或右侧的边界线。
[0038]一种实施方式中,旋转单元用于:
[0039]若确定文本旋转角度不高于文本旋转角度阈值,则将原始图像确定为文本旋转图像;
[0040]若确定文本旋转角度高于文本旋转角度阈值,则将原始图像中的文本内容,按照指定旋转方向旋转文本旋转角度,获得文本旋转图像。
[0041]一种实施方式中,旋转单元用于:
[0042]根据文本旋转角度以及指定旋转方向,生成仿射变换矩阵;
[0043]基于仿射变换矩阵,对原始图像进行仿真变换,获得文本旋转图像。
[0044]一种实施方式中,旋转单元用于:
[0045]若文本旋转角度为多个且各文本旋转角度符合设定平均条件,则确定各文本旋转角度的平均值;按照平均值,旋转矫正原始图像中的文本内容;
[0046]若文本旋转角度为多个且各文本旋转角度符合设定差值条件,则根据各第一文本检测框的文本旋转角度对各自包含的文本内容进行旋转矫正。
[0047]一方面,提供了一种电子设备,包括处理器以及存储器,存储器存储有计算机可读取指令,当计算机可读取指令由处理器执行时,运行如上述任一种文字行检测的各种可选实现方式中提供的方法的步骤。
[0048]一方面,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时运行如上述任一种文字行检测的各种可选实现方式中提供的方法的步骤。
[0049]一方面,提供了一种计算机程序产品,计算机程序产品在计算机上运行时,使得计算机执行如上述任一种文字行检测的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文字行检测的方法,其特征在于,包括:对待处理的原始图像进行文字行检测,获得第一文本检测框;确定所述第一文本检测框的文本旋转角度;根据所述文本旋转角度,对所述原始图像中的文本内容进行旋转矫正,获得文本旋转图像;对所述文本旋转图像进行文字行检测,获得第二文本检测框;根据所述文本旋转角度,对所述第二文本检测框及其包含的文本内容进行逆旋转,获得检测框图像。2.如权利要求1所述的方法,其特征在于,所述确定所述第一文本检测框的文本旋转角度,包括:确定所述第一文本检测框的上下边界线与水平线之间的角度,获得所述文本旋转角度;所述上下边界线为所述第一文本检测框上侧的边界线或下侧的边界线;或者,确定所述第一文本检测框的左右边界线与垂直线之间的角度,获得所述文本旋转角度;所述左右边界线为所述第一文本检测框左侧的边界线或右侧的边界线。3.如权利要求1所述的方法,其特征在于,所述根据所述文本旋转角度,对所述原始图像中的文本内容进行旋转矫正,包括:若确定所述文本旋转角度不高于文本旋转角度阈值,则将所述原始图像确定为所述文本旋转图像;若确定所述文本旋转角度高于所述文本旋转角度阈值,则将所述原始图像中的文本内容,按照指定旋转方向旋转所述文本旋转角度,获得所述文本旋转图像。4.如权利要求3所述的方法,其特征在于,所述将所述原始图像中的文本内容,按照指定旋转方向旋转所述文本旋转角度,获得所述文本旋转图像,包括:根据所述文本旋转角度以及所述指定旋转方向,生成仿射变换矩阵;基于所述仿射变换矩阵,对所述原始图像进行仿真变换,获得所述文本旋转图像。5.如权利要求1

4任一项所述的方法,其特征在于,所述根据所述文本旋转角度,对所述原始图像中的文本内容进行旋转矫正,包括:若所述文本旋转角度为多个且各文本旋转角度符合设定平均条件,则确定各文本旋转角度的平均值;按照所述平均值,旋...

【专利技术属性】
技术研发人员:王雷石明乾张睿周健周元剑
申请(专利权)人:上海弘玑信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1