文本方向识别方法、装置、设备及存储介质制造方法及图纸

技术编号:35648147 阅读:19 留言:0更新日期:2022-11-19 16:42
本发明专利技术涉及人工智能,提供一种文本方向识别方法、装置、设备及存储介质。该方法对获取到的训练灰度图像进行图像增强处理,得到目标训练图像,基于目标训练图像调整预设检测网络,得到文本检测模型,对获取的待检测文本图像进行灰度化处理,得到灰度图像,基于文本检测模型定位出灰度图像中的文本区域,切分文本区域,得到多个目标区域,基于多个目标区域的旋转角度生成文本方向。此外,本发明专利技术还涉及区块链技术,所述文本方向可存储于区块链中。所述文本方向可存储于区块链中。所述文本方向可存储于区块链中。

【技术实现步骤摘要】
文本方向识别方法、装置、设备及存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种文本方向识别方法、装置、设备及存储介质。

技术介绍

[0002]在目前对文本方向进行识别的方案中,通常是将文本区域变换为某一尺寸限度的图像,以便检测模型的识别,然而,这种对文本区域进行变换的方式导致一定的弹性形变,造成检测模型无法准确的识别出文本方向。

技术实现思路

[0003]鉴于以上内容,有必要提供一种文本方向识别方法、装置、设备及存储介质,能够解决无法准确的识别出文本方向的技术问题。
[0004]一方面,本专利技术提出一种文本方向识别方法,所述文本方向识别方法包括:
[0005]对获取到的训练灰度图像进行图像增强处理,得到目标训练图像;
[0006]基于所述目标训练图像调整预设检测网络中的网络参数,得到文本检测模型;
[0007]根据接收到的文本方向识别请求获取待检测文本图像;
[0008]对所述待检测文本图像进行灰度化处理,得到灰度图像;
[0009]基于所述文本检测模型定位出所述灰度图像中的文本区域;
[0010]切分所述文本区域,得到多个目标区域;
[0011]基于所述多个目标区域的旋转角度生成所述待检测文本图像的文本方向。
[0012]根据本专利技术优选实施例,所述对获取到的训练灰度图像进行图像增强处理,得到目标训练图像包括:
[0013]从多个预设应用场景中获取场景文本图像;
[0014]对所述场景文本图像进行灰度化处理,得到所述训练灰度图像;
[0015]对所述训练灰度图像进行旋转处理,得到初始训练图像;
[0016]若所述初始训练图像的图像数量小于预设数量,则从所述初始训练图像中提取任意两张图像,所述任意两张图像包括第一图像及第二图像;
[0017]按照预设比例调整所述第一图像中的图像像素值,得到第三图像;
[0018]对所述第二图像与所述第三图像进行合成处理,得到所述目标训练图像。
[0019]根据本专利技术优选实施例,所述基于所述目标训练图像调整预设检测网络中的网络参数,得到文本检测模型包括:
[0020]获取所述目标训练图像的训练像素信息;
[0021]基于所述训练像素信息对所述目标训练图像进行编码处理,得到图像向量;
[0022]将所述图像向量输入至所述预设检测网络中的文本位置识别层,得到文本像素位置;
[0023]将所述文本像素位置输入至所述预设检测网络中的输出层进行位置连续性分析,
得到预测区域位置;
[0024]基于所述目标训练图像的标注区域位置与所述预测区域位置的位置差距调整所述网络参数,直至所述位置差距不再降低,得到所述文本检测模型。
[0025]根据本专利技术优选实施例,所述对所述待检测文本图像进行灰度化处理,得到灰度图像包括:
[0026]获取所述待检测文本图像在多个颜色通道上的通道值;
[0027]基于多个所述通道值计算所述待检测文本图像中每个图像像素点的灰度值;
[0028]基于每个图像像素点的灰度值构建所述灰度图像。
[0029]根据本专利技术优选实施例,所述切分所述文本区域,得到多个目标区域包括:
[0030]基于所述文本区域的区域尺寸识别所述文本区域的区域形状;
[0031]若所述区域形状不为预设形状,则在所述灰度图像中扩张所述文本区域,得到测试区域;
[0032]获取与所述预设形状对应的形状尺寸阈值;
[0033]依据所述形状尺寸阈值对所述测试区域进行切分,得到所述多个目标区域。
[0034]根据本专利技术优选实施例,所述基于所述多个目标区域的旋转角度生成所述待检测文本图像的文本方向包括:
[0035]基于预先训练完成的角度识别网络并行识别所述多个目标区域,得到多个所述旋转角度;
[0036]统计所述多个旋转角度处于每个角度区间的角度数量;
[0037]将所述角度数量最大的角度区间所对应的方向确定为所述文本方向。
[0038]根据本专利技术优选实施例,在基于所述多个目标区域的旋转角度生成所述待检测文本图像的文本方向之后,所述方法还包括:
[0039]基于所述文本方向对所述文本区域进行旋转,得到校正区域;
[0040]获取所述校正区域的区域像素信息;
[0041]提取所述区域像素信息的特征信息;
[0042]基于预设文本映射表对所述特征信息进行映射处理,得到所述待检测文本图像中的目标文本。
[0043]另一方面,本专利技术还提出一种文本方向识别装置,所述文本方向识别装置包括:
[0044]增强单元,用于对获取到的训练灰度图像进行图像增强处理,得到目标训练图像;
[0045]调整单元,用于基于所述目标训练图像调整预设检测网络中的网络参数,得到文本检测模型;
[0046]获取单元,用于根据接收到的文本方向识别请求获取待检测文本图像;
[0047]处理单元,用于对所述待检测文本图像进行灰度化处理,得到灰度图像;
[0048]定位单元,用于基于所述文本检测模型定位出所述灰度图像中的文本区域;
[0049]切分单元,用于切分所述文本区域,得到多个目标区域;
[0050]生成单元,用于基于所述多个目标区域的旋转角度生成所述待检测文本图像的文本方向。
[0051]另一方面,本专利技术还提出一种电子设备,所述电子设备包括:
[0052]存储器,存储计算机可读指令;及
[0053]处理器,执行所述存储器中存储的计算机可读指令以实现所述文本方向识别方法。
[0054]另一方面,本专利技术还提出一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可读指令,所述计算机可读指令被电子设备中的处理器执行以实现所述文本方向识别方法。
[0055]由以上技术方案可以看出,本申请基于图像增强处理后所得到的目标训练图像对预设检测网络进行调参,由于扩增了图像训练量,以及,调整预设检测网络的目标训练图像术语灰度图,因此能够提高文本检测模型的泛化能力,进一步地,通过对文本区域进行切分,能够避免对文本区域进行压缩而导致文本信息发生弹性形变,从而提高所述文本方向的识别准确性。此外,由于同一文档中具备文字方向一致的现象,因此通过结合所述多个目标区域的旋转角度能够准确的识别出所述文本方向。
附图说明
[0056]图1是本专利技术文本方向识别方法的较佳实施例的流程图。
[0057]图2是本专利技术文本方向识别装置的较佳实施例的功能模块图。
[0058]图3是本专利技术实现文本方向识别方法的较佳实施例的电子设备的结构示意图。
具体实施方式
[0059]为了使本专利技术的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本专利技术进行详细描述。
[0060]如图1所示,是本专利技术文本方向识别方法的较佳实施例的流程图。根据不本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本方向识别方法,其特征在于,所述文本方向识别方法包括:对获取到的训练灰度图像进行图像增强处理,得到目标训练图像;基于所述目标训练图像调整预设检测网络中的网络参数,得到文本检测模型;根据接收到的文本方向识别请求获取待检测文本图像;对所述待检测文本图像进行灰度化处理,得到灰度图像;基于所述文本检测模型定位出所述灰度图像中的文本区域;切分所述文本区域,得到多个目标区域;基于所述多个目标区域的旋转角度生成所述待检测文本图像的文本方向。2.如权利要求1所述的文本方向识别方法,其特征在于,所述对获取到的训练灰度图像进行图像增强处理,得到目标训练图像包括:从多个预设应用场景中获取场景文本图像;对所述场景文本图像进行灰度化处理,得到所述训练灰度图像;对所述训练灰度图像进行旋转处理,得到初始训练图像;若所述初始训练图像的图像数量小于预设数量,则从所述初始训练图像中提取任意两张图像,所述任意两张图像包括第一图像及第二图像;按照预设比例调整所述第一图像中的图像像素值,得到第三图像;对所述第二图像与所述第三图像进行合成处理,得到所述目标训练图像。3.如权利要求1所述的文本方向识别方法,其特征在于,所述基于所述目标训练图像调整预设检测网络中的网络参数,得到文本检测模型包括:获取所述目标训练图像的训练像素信息;基于所述训练像素信息对所述目标训练图像进行编码处理,得到图像向量;将所述图像向量输入至所述预设检测网络中的文本位置识别层,得到文本像素位置;将所述文本像素位置输入至所述预设检测网络中的输出层进行位置连续性分析,得到预测区域位置;基于所述目标训练图像的标注区域位置与所述预测区域位置的位置差距调整所述网络参数,直至所述位置差距不再降低,得到所述文本检测模型。4.如权利要求1所述的文本方向识别方法,其特征在于,所述对所述待检测文本图像进行灰度化处理,得到灰度图像包括:获取所述待检测文本图像在多个颜色通道上的通道值;基于多个所述通道值计算所述待检测文本图像中每个图像像素点的灰度值;基于每个图像像素点的灰度值构建所述灰度图像。5.如权利要求1所述的文本方向识别方法,其特征在于,所述切分所述文本区域,得到多个目标区...

【专利技术属性】
技术研发人员:赵学斌
申请(专利权)人:中国平安财产保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1