文本处理方法、装置、存储介质及计算机设备制造方法及图纸

技术编号:35197757 阅读:14 留言:0更新日期:2022-10-12 18:31
本申请提供的文本处理方法、装置、存储介质及计算机设备,在对文本图像进行OCR识别之前,可以获取该文本图像及与该文本图像对应的高斯热力图,该高斯热力图中包含有目标文本区域,因此,本申请可以仅确定目标文本区域中的文本框及文本框类型,无需关注高斯热力图中的其他区域,这样既可以精准矫正,又可以提升处理效率;当确定目标文本区域的文本框对应的文本框类型后,本申请还可以针对不同的文本框类型进行针对性的调整,这样得到的目标文本既包含了原有的文本信息,又简化了文本的识别难度,从而有效提高文本识别准确率。从而有效提高文本识别准确率。从而有效提高文本识别准确率。

【技术实现步骤摘要】
文本处理方法、装置、存储介质及计算机设备


[0001]本申请涉及图像处理
,尤其涉及一种文本处理方法、装置、存储介质及计算机设备。

技术介绍

[0002]OCR识别(光学字符识别)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。亦即对图像中的文字进行识别,并以文本的形式返回。由于OCR识别技术具有准确性高、稳定性强、简单易用等特点,广泛应用于教育领域、医疗领域、工业领域等。例如,可以将OCR识别技术应用于PDA(扫描枪)上,作为条码、二维码识别的补充。
[0003]目前,在将OCR识别技术应用于PDA的过程中,由于识别场景不固定,识别到的文字可能存在弯曲、大小不一等情况,导致最终的识别结果的准确性较低。

技术实现思路

[0004]本申请的目的旨在至少能解决上述的技术缺陷之一,特别是现有技术中在将OCR识别技术应用于PDA的过程中,由于识别场景不固定,识别到的文字可能存在弯曲、大小不一等情况,导致最终的识别结果的准确性较低的技术缺陷。
[0005]本申请提供了一种文本处理方法,所述方法包括:
[0006]获取待处理的文本图像以及与所述文本图像对应的高斯热力图,所述高斯热力图中包含目标文本区域;
[0007]确定所述目标文本区域中的文本框以及文本框类型,所述文本框类型包括弯曲型文本框和直线型文本框;
[0008]若所述文本框为弯曲型文本框,则按照所述文本框的弯曲程度对所述文本框进行分割,并依据分割后的文本框对所述文本图像中的文本进行裁剪并拼接,得到目标文本;
[0009]若所述文本框为直线型文本框,则依据所述目标文本区域中文本框的个数以及所述文本框在所述高斯热力图中的位置,对所述文本图像中相同位置处的的文本进行裁剪,得到目标文本。
[0010]可选地,所述确定所述目标文本区域中的文本框,包括:
[0011]按照预设的二值化阈值对所述高斯热力图进行至少一次二值化操作后得到二值化图像,所述高斯热力图在进行两次以上二值化操作时,每次二值化操作采用的二值化阈值不同;
[0012]确定所述二值化图像中位于所述目标文本区域的每一文字轮廓对应的最小外接矩形,并按照每一最小外接矩形在所述文本图像中对应的文本对各个最小外接矩形进行划分,得到文本框。
[0013]可选地,所述目标文本区域中的文本框包含至少一个最小外接矩形;
[0014]所述确定所述目标文本区域中的文本框的文本框类型,包括:
[0015]判断所述目标文本区域中的文本框所包含的最小外接矩形的个数是否超过预设
个数值;
[0016]若不超过,则确定所述文本框为直线型文本框;
[0017]若超过,则根据所述文本框中的各个最小外接矩形的中点位置,确定所述文本框的文本框类型。
[0018]可选地,所述根据所述文本框中的各个最小外接矩形的中点位置,确定所述文本框的文本框类型,包括:
[0019]按照所述文本框中的各个最小外接矩形的中点位置的排列顺序,将排列顺序最前的两个相邻的最小外接矩形的中点进行连线,得到基准直线;
[0020]按照所述排列顺序,将所述两个相邻的最小外接矩形之后的最小外接矩形的中点,依次与所述两个相邻的最小外接矩形中排列顺序靠后的最小外接矩形的中点进行连线,得到至少一条测量直线;
[0021]判断所述基准直线与每一测量直线之间的夹角是否大于预设角度值;
[0022]若至少一个夹角大于所述预设角度值,则确定所述文本框为弯曲型文本型;
[0023]若所有的夹角均不大于所述预设角度值,则确定所述文本框为直线型文本框。
[0024]可选地,所述按照所述文本框的弯曲程度对所述文本框进行分割,得到分割后的文本框,包括:
[0025]获取首次判断所述夹角大于所述预设角度值时对应的测量直线;
[0026]将该测量直线的两个端点中排列顺序靠后的端点对应的最小外接矩形作为第一最小外接矩形,以及将该测量直线的前一测量直线的两个端点中排序靠后的端点对应的最小外接矩形作为第二最小外接矩形;
[0027]根据所述第一最小外接矩形与所述第二最小外接矩形之间的位置关系,对所述文本框进行分割,得到由排列顺序靠前的最小外接矩形组成的文本框,以及由排列顺序靠后的最小外接矩形组成的文本框;
[0028]判断所述排列顺序靠后的最小外接矩形组成的文本框中最小外接矩形的个数;
[0029]若所述最小外接矩形的个数为两个以下,则结束分割操作;
[0030]若所述最小外接矩形的个数为至少三个,则将所述排列顺序靠后的最小外接矩形组成的文本框作为新的文本框,并返回执行按照所述文本框中的各个最小外接矩形的中点位置的排列顺序,将排列顺序最前的两个相邻的最小外接矩形的中点进行连线,得到基准直线的步骤,直到结束分割操作为止,得到分割后的文本框。
[0031]可选地,所述根据所述第一最小外接矩形与所述第二最小外接矩形之间的位置关系,对所述文本框进行分割,包括:
[0032]将所述第一最小外接矩形与所述第二最小外接矩形的中点进行连线,得到矩形连接线;
[0033]以所述矩形连接线的中点位置为原点,作平行于所述第二最小外接矩形的右侧矩形边的分割线,并根据所述分割线对所述文本框进行分割。
[0034]可选地,所述依据分割后的文本框对所述文本图像中的文本进行裁剪并拼接,得到目标文本,包括:
[0035]按照预设的膨胀倍数对所述分割后的文本框进行膨胀,得到膨胀后的文本框;
[0036]根据所述膨胀后的文本框,对所述文本图像中相应区域的文本进行裁剪,得到多
个初始文本;
[0037]根据每个初始文本在所述文本图像中的排列顺序,对各个初始文本进行拼接,得到目标文本。
[0038]可选地,所述依据所述目标文本区域中文本框的个数以及所述文本框在所述高斯热力图中的位置,对所述文本图像中相同位置处的文本进行裁剪,得到目标文本,包括:
[0039]当所述文本框为一个时,依据所述文本框在所述高斯热力图中的位置,对所述文本图像中相同位置处的文本进行裁剪,得到目标文本;
[0040]当所述文本框为多个时,依据各个文本框在所述高斯热力图中的位置,确定是否存在位于同一行的文本框;
[0041]若存在,则将位于同一行的文本框进行合并,并根据合并后的文本框对所述文本图像中的文本进行裁剪,得到目标文本;
[0042]若不存在,则按照每一文本框在所述高斯热力图中的位置,对所述文本图像中相同位置处的文本进行裁剪,得到目标文本。
[0043]可选地,所述依据各个文本框在所述高斯热力图中的位置,确定是否存在位于同一行的文本框,包括:
[0044]在各个文本框中选取任意两个文本框,并确定选取的所述任意两个文本框在所述高斯热力图中的位置;
[0045]根据所述任意两个文本框在所述高斯热力图中的位置,确认所述任意两个文本框是否位于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本处理方法,其特征在于,所述方法包括:获取待处理的文本图像以及与所述文本图像对应的高斯热力图,所述高斯热力图中包含目标文本区域;确定所述目标文本区域中的文本框以及文本框类型,所述文本框类型包括弯曲型文本框和直线型文本框;若所述文本框为弯曲型文本框,则按照所述文本框的弯曲程度对所述文本框进行分割,并依据分割后的文本框对所述文本图像中的文本进行裁剪并拼接,得到目标文本;若所述文本框为直线型文本框,则依据所述目标文本区域中文本框的个数以及所述文本框在所述高斯热力图中的位置,对所述文本图像中相同位置处的的文本进行裁剪,得到目标文本。2.根据权利要求1所述的文本处理方法,其特征在于,所述确定所述目标文本区域中的文本框,包括:按照预设的二值化阈值对所述高斯热力图进行至少一次二值化操作后得到二值化图像,所述高斯热力图在进行两次以上二值化操作时,每次二值化操作采用的二值化阈值不同;确定所述二值化图像中位于所述目标文本区域的每一文字轮廓对应的最小外接矩形,并按照每一最小外接矩形在所述文本图像中对应的文本对各个最小外接矩形进行划分,得到文本框。3.根据权利要求1所述的文本处理方法,其特征在于,所述目标文本区域中的文本框包含至少一个最小外接矩形;所述确定所述目标文本区域中的文本框的文本框类型,包括:判断所述目标文本区域中的文本框所包含的最小外接矩形的个数是否超过预设个数值;若不超过,则确定所述文本框为直线型文本框;若超过,则根据所述文本框中的各个最小外接矩形的中点位置,确定所述文本框的文本框类型。4.根据权利要求3所述的文本处理方法,其特征在于,所述根据所述文本框中的各个最小外接矩形的中点位置,确定所述文本框的文本框类型,包括:按照所述文本框中的各个最小外接矩形的中点位置的排列顺序,将排列顺序最前的两个相邻的最小外接矩形的中点进行连线,得到基准直线;按照所述排列顺序,将所述两个相邻的最小外接矩形之后的最小外接矩形的中点,依次与所述两个相邻的最小外接矩形中排列顺序靠后的最小外接矩形的中点进行连线,得到至少一条测量直线;判断所述基准直线与每一测量直线之间的夹角是否大于预设角度值;若至少一个夹角大于所述预设角度值,则确定所述文本框为弯曲型文本型;若所有的夹角均不大于所述预设角度值,则确定所述文本框为直线型文本框。5.根据权利要求4所述的文本处理方法,其特征在于,所述按照所述文本框的弯曲程度对所述文本框进行分割,得到分割后的文本框,包括:获取首次判断所述夹角大于所述预设角度值时对应的测量直线;
将该测量直线的两个端点中排列顺序靠后的端点对应的最小外接矩形作为第一最小外接矩形,以及将该测量直线的前一测量直线的两个端点中排序靠后的端点对应的最小外接矩形作为第二最小外接矩形;根据所述第一最小外接矩形与所述第二最小外接矩形之间的位置关系,对所述文本框进行分割,得到由排列顺序靠前的最小外接矩形组成的文本框,以及由排列顺序靠后的最小外接矩形组成的文本框;判断所述排列顺序靠后的最小外接矩形组成的文本框中最小外接矩形的个数;若所述最小外接矩形的个数为两个以下,则结束分割操作;若所述最小外接矩形的个数为至少三个,则将所述排列顺序靠后的最小外接矩形组成的文本框作为新的文本框,并返回执行按照所述文本框中的各个最小外接矩形的中点位置的排列顺序,将排列顺序最前的两个相邻的最小外接矩形的中点进行连线,得到基准直线的步骤,直到结束分割操作为止,得到分割后的文本框。6.根据权利要求5所述的文本处理方法,其特征在于,所述根据所述第一最小外接矩形与所述第二最小外接矩形之间的位置关系,对所述文本框进行分割,包括:将所述第一最小外接矩形与所述第二最小外接矩形的中点进行连线,得到矩形连接线;以所述矩形连接线的中点位置为原点,作平行于所述第二最小外接矩形的右侧矩形边的分割线,并根据所述分割线对所述文本框进行分割。7.根据权利要求1所述的文本处理方法,其特征在于,所述依据分割后的文本框对所述文本图像中的文本进行裁剪并拼接,得到目标文本,包括:按照预设的膨胀倍数对所述分割后的文本框进行膨胀,得到膨胀后的文本框;根据所述膨胀后的文本框,对所述文本图像中相应区域的文本进行裁剪,得到多个初始文本;根据每个初始文本在所述文本图像中的排列顺序,对各个初始文本进行拼接,得到目标文本。8.根据权利要求1所述的文本处理方法,其特征在于,所述依据所述目标文本区域中文本框的个数以及所述文本框在所述高斯热力图中的位置,对所述文本图像中相同位置处的文本进行裁剪,得到目标文本,包括:当所述文本框为一个时,依据所述文本框在所述高斯热力图中的位置,对所述文本图像中相同位置处的文本进行裁剪,得到目标文本;当所述文本框为多个时,依据各个文...

【专利技术属性】
技术研发人员:顾善中惠慧田晓明
申请(专利权)人:东集技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1