文档图像矫正方法、装置、电子设备及可读介质制造方法及图纸

技术编号:37960481 阅读:10 留言:0更新日期:2023-06-30 09:35
本发明专利技术公开了一种文档图像矫正方法、装置、电子设备及可读介质,该文档图像矫正方法,包括:获取待矫正文档图像相对于其标准方向,分别偏置0

【技术实现步骤摘要】
文档图像矫正方法、装置、电子设备及可读介质


[0001]本专利技术是关于图像处理
,特别是关于一种文档图像矫正方法、装置、电子设备及可读介质。

技术介绍

[0002]现有技术中,文档图像中的文本内容一般是通过OCR(Optical Character Recognition,光学字符识别)技术识别。在进行OCR识别时,通常要求文档图像的放置方向与OCR的识别方向匹配,否则容易导致OCR识别结果错误,出现大量的乱码。
[0003]因此,针对上述技术问题,有必要提供一种文档图像矫正方法、装置、电子设备及可读介质。

技术实现思路

[0004]本专利技术的目的在于提供一种文档图像矫正方法、装置、电子设备及可读介质,其能够矫正文档图像的方向,以提高文档图像的OCR识别准确率。
[0005]为实现上述目的,本专利技术提供的技术方案如下:
[0006]第一方面,本专利技术提供了一种文档图像矫正方法,其包括:
[0007]获取待矫正文档图像相对于其标准方向,分别偏置0
°
、90
°
、180
°
和270
°
的偏置概率;当所述偏置概率中的最大概率大于第一阈值时,基于所述最大概率对应的偏置角度矫正所述待矫正文档图像至所述标准方向;当所述偏置概率中的最大概率小于或等于第一阈值时,对所述待矫正文档图像的文本内容进行识别,判断所述文本内容的识别结果是否具有语义信息,并基于所述识别结果的语义信息判断结果矫正所述待矫正文档图像至所述标准方向。
[0008]在一个或多个实施方式中,基于所述识别结果的语义信息判断结果矫正所述待矫正文档图像,包括:当所述识别结果具有语义信息时,确定所述待矫正文档图像当前方向为所述标准方向。
[0009]在一个或多个实施方式中,对所述待矫正文档图像的文本内容进行识别,判断所述文本内容的识别结果是否具有语义信息,并基于所述识别结果的语义信息判断结果矫正所述待矫正文档图像至所述标准方向,包括:对所述待矫正文档图像进行文本检测,对所述文本检测的结果进行文本识别,以获取所述待矫正文档图像的文本内容的识别结果;当所述识别结果不具有语义信息时,基于具有横向和纵向文本字条检测功能的文本检测模型确定所述待矫正文档图像的偏置角度,并基于所述偏置角度矫正所述待矫正文档图像至所述标准方向。
[0010]在一个或多个实施方式中,对所述待矫正文档图像的文本内容进行识别,判断所述文本内容的识别结果是否具有语义信息,并基于所述识别结果的语义信息判断结果矫正所述待矫正文档图像至所述标准方向,包括:对所述待矫正文档图像进行文本检测,对所述文本检测的结果进行文本识别,以获取所述待矫正文档图像的文本内容的识别结果;当所
述识别结果不具有语义信息时,基于所述文本检测和所述文本识别的结果确定所述待矫正文档图像的偏置角度,并基于所述偏置角度矫正所述待矫正文档图像至所述标准方向。
[0011]在一个或多个实施方式中,基于所述文本检测和所述文本识别的结果确定所述待矫正文档图像的偏置角度,包括:基于横向文本检测模型对所述待矫正文档图像进行文本检测,对所述文本检测的结果进行文本识别;基于所述文本识别的结果,确定所述待矫正文档图像中文本字条的偏置角度。
[0012]在一个或多个实施方式中,基于所述文本识别的结果,确定所述待矫正文档图像中文本字条的偏置角度,包括:基于所述文本识别的结果,确定所述文本检测的结果中单字符文本框相对于总文本框的占比;当所述占比大于第二阈值时,所述待矫正文档图像中文本字条的偏置角度确定为90
°
或270
°
;当所述占比小于或等于第二阈值时,所述待矫正文档图像中文本字条的偏置角度确定为180
°

[0013]在一个或多个实施方式中,基于所述偏置角度矫正所述待矫正文档图像,包括:当所述待矫正文档图像的偏置角度为180
°
时,将所述待矫正文档图像旋转180
°
,以矫正所述待矫正文档图像至所述标准方向。
[0014]在一个或多个实施方式中,基于所述偏置角度矫正所述待矫正文档图像,包括:当所述待矫正文档图像的偏置角度为90
°
或270
°
时,将所述待矫正文档图像旋转90
°
;对所述旋转后的待矫正文档图像的文本内容进行识别,判断所述文本内容的识别结果是否具有语义信息;当所述识别结果具有语义信息时,确定所述旋转后的待矫正文档图像当前方向为所述标准方向;当所述识别结果不具有语义信息时,将所述旋转后的待矫正文档图像旋转180
°
,以矫正所述待矫正文档图像至所述标准方向。
[0015]在一个或多个实施方式中,获取待矫正文档图像相对于其标准方向,分别偏置0
°
、90
°
、180
°
和270
°
的偏置概率,包括:将待矫正文档图像输入旋转模型,基于所述旋转模型对所述待矫正文档图像的图像特征进行分类;基于所述分类结果,输出所述待矫正文档图像相对于其标准方向,分别偏置0
°
、90
°
、180
°
和270
°
的偏置概率。
[0016]第二方面,本专利技术提供了一种文档图像矫正装置,其包括:
[0017]获取模块,用于获取待矫正文档图像相对于其标准方向,分别偏置0
°
、90
°
、180
°
和270
°
的偏置概率;第一矫正模块,用于在所述偏置概率中的最大概率大于第一阈值时,基于所述最大概率对应的偏置角度矫正所述待矫正文档图像至所述标准方向;第二矫正模块,用于在所述偏置概率中的最大概率小于或等于第一阈值时,对所述待矫正文档图像的文本内容进行识别,判断所述文本内容的识别结果是否具有语义信息,并基于所述识别结果的语义信息判断结果矫正所述待矫正文档图像至所述标准方向。
[0018]第三方面,本专利技术提供了一种电子设备,包括存储器、处理器、以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如前所述的文档图像矫正方法。
[0019]第四方面,本专利技术提供了一种计算机可读介质,所述计算机可读介质中承载有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如前所述的文档图像矫正方法。
[0020]与现有技术相比,本专利技术提供的文档图像矫正方法及装置,通过获取待矫正文档图像相对于其标准方向,分别偏置0
°
、90
°
、180
°
和270
°
的偏置概率,并基于该偏置概率对待
矫正文档图像进行矫正,能够将待矫正文档图像矫正至其标准方向,以提高文档图像的OCR识别准确率;该方法可基于偏置概率,对偏置角度置信度较高的文档图像直接进行旋转矫正,对偏置角度置信本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文档图像矫正方法,其特征在于,包括:获取待矫正文档图像相对于其标准方向,分别偏置0
°
、90
°
、180
°
和270
°
的偏置概率;当所述偏置概率中的最大概率大于第一阈值时,基于所述最大概率对应的偏置角度矫正所述待矫正文档图像至所述标准方向;当所述偏置概率中的最大概率小于或等于第一阈值时,对所述待矫正文档图像的文本内容进行识别,判断所述文本内容的识别结果是否具有语义信息,并基于所述识别结果的语义信息判断结果矫正所述待矫正文档图像至所述标准方向。2.如权利要求1所述的文档图像矫正方法,其特征在于,基于所述识别结果的语义信息判断结果矫正所述待矫正文档图像,包括:当所述识别结果具有语义信息时,确定所述待矫正文档图像当前方向为所述标准方向。3.如权利要求1所述的文档图像矫正方法,其特征在于,对所述待矫正文档图像的文本内容进行识别,判断所述文本内容的识别结果是否具有语义信息,并基于所述识别结果的语义信息判断结果矫正所述待矫正文档图像至所述标准方向,包括:对所述待矫正文档图像进行文本检测,对所述文本检测的结果进行文本识别,以获取所述待矫正文档图像的文本内容的识别结果;当所述识别结果不具有语义信息时,基于具有横向和纵向文本字条检测功能的文本检测模型确定所述待矫正文档图像的偏置角度,并基于所述偏置角度矫正所述待矫正文档图像至所述标准方向。4.如权利要求1所述的文档图像矫正方法,其特征在于,对所述待矫正文档图像的文本内容进行识别,判断所述文本内容的识别结果是否具有语义信息,并基于所述识别结果的语义信息判断结果矫正所述待矫正文档图像至所述标准方向,包括:对所述待矫正文档图像进行文本检测,对所述文本检测的结果进行文本识别,以获取所述待矫正文档图像的文本内容的识别结果;当所述识别结果不具有语义信息时,基于所述文本检测和所述文本识别的结果确定所述待矫正文档图像的偏置角度,并基于所述偏置角度矫正所述待矫正文档图像至所述标准方向。5.如权利要求4所述的文档图像矫正方法,其特征在于,基于所述文本检测和所述文本识别的结果确定所述待矫正文档图像的偏置角度,包括:基于横向文本检测模型对所述待矫正文档图像进行文本检测,对所述文本检测的结果进行文本识别;基于所述文本识别的结果,确定所述待矫正文档图像中文本字条的偏置角度。6.如权利要求5所述的文档图像矫正方法,其特征在于,基于所述文本识别的结果,确定所述待矫正文档图像中文本字条的偏置角度,包括:基于所述文本识别的结果,确定所述文本检测的结果中单字符文本框相对于总文本框的占比;当所述占比大于第二阈值时,所述待矫正文档图像中文本字条的偏置角度确定为90
°
或270
°
;当所述占比小于或等于第二阈值时,所述待矫正文档图像中文本字条的偏置角度确定<...

【专利技术属性】
技术研发人员:陶提
申请(专利权)人:上海太美数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1