一种图像处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:37350557 阅读:15 留言:0更新日期:2023-04-22 21:49
本申请提供一种图像处理方法、装置、电子设备及存储介质,该方法包括:从待检测图像中获得文本区域,每一文本区域包括旋转角度、区域宽度和区域高度;根据多个文本区域的旋转角度以及预设的第一角度阈值,对文本区域的旋转角度进行修正,获得修正旋转角度;根据文本区域的修正旋转角度、区域宽度和区域高度,对文本区域进行方向校准,获得待检测区域。从待检测图像中获得文本区域,对文本区域的旋转角度进行修正,使得待检测图像中的各文本区域的方向一致;再根据修正旋转角度、区域宽度和区域高度,对文本区域进行方向校准,获得待检测区域,以使待检测区域为水平方向。待检测区域方向统一且水平,降低了误差,提高了检测的准确性和效率。性和效率。性和效率。

【技术实现步骤摘要】
一种图像处理方法、装置、电子设备及存储介质


[0001]本申请涉及图像处理领域,具体而言,涉及一种图像处理方法、装置、电子设备及存储介质。

技术介绍

[0002]随着互联网计算机技术的快速发展,数量繁多的多媒体信息出现在人们的日常生活中,很多业务需要对图像中的信息进行计算机分析和理解来识别其中的有效信息。目前的OCR(Optical Character Recognition,光学字符识别)等方式对文本进行识别,直接对图像整体进行识别,通常会因为识别结果的文本方向等原因,导致图像处理准确率较低。

技术实现思路

[0003]本专利技术实施例的目的在于一种图像处理方法、装置、电子设备及存储介质,对从图像中获得的文本区域进行方向校准,获得待检测区域,提高图像处理准确率。
[0004]第一方面,本申请实施例提供了一种图像处理方法,包括:从待检测图像中获得文本区域,每一文本区域包括旋转角度、区域宽度和区域高度;根据多个文本区域的旋转角度以及预设的第一角度阈值,对文本区域的旋转角度进行修正,获得修正旋转角度;根据文本区域的修正旋转角度、区域宽度和区域高度,对文本区域进行方向校准,获得待检测区域。
[0005]在上述的实现过程中,从待检测图像中获得文本区域,对文本区域的旋转角度进行修正,使得待检测图像中的各文本区域的方向一致;再根据修正旋转角度、区域宽度和区域高度,对文本区域进行方向校准,获得待检测区域,以使待检测区域为水平方向。由于待检测区域方向一致且水平,避免文本方向不一致导致的检测误差,提高了检测的准确性和效率。
[0006]可选的,在本申请实施例中,根据多个文本区域的旋转角度以及预设的第一角度阈值,对文本区域的旋转角度进行修正,获得修正旋转角度,包括:根据多个文本区域的旋转角度,获得多个文本区域中旋转角度最大值和旋转角度最小值的差值;若差值大于第一角度阈值,则对旋转角度小于预设的第二角度阈值的文本区域的旋转角度进行修正,获得修正旋转角度。
[0007]在上述的实现过程中,通过多个文本区域中旋转角度最大值和旋转角度最小值的差值,与预设的第一角度阈值进行比较,对文本区域的旋转角度进行修正,根据修正旋转角度进行仿射变化,以使修正后的文本区域方向统一,改善因为同一待检测图像中的文本区域的文本方向不一致导致的检测准确率较低的问题。
[0008]可选的,在本申请实施例中,根据文本区域的修正旋转角度、区域宽度和区域高度,对文本区域进行方向校准,获得待检测区域,包括:根据每一文本区域的区域宽度和区域高度,获得每一文本区域的宽高比;根据每一文本区域的宽高比,获得多个文本区域的宽高比均值;根据文本区域的修正旋转角度和宽高比均值,对文本区域进行方向校准,获得待检测区域。
[0009]在上述的实现过程中,根据文本区域的修正旋转角度和宽高比均值,对文本区域进行方向校准,以使待检测区域均为可以直接输入识别网络的横向文本,提高图像处理准确率。
[0010]可选的,在本申请实施例中,根据文本区域的修正旋转角度和宽高比均值,对文本区域进行方向校准,获得待检测区域,包括:根据修正旋转角度对文本区域进行仿射变换,获得文本矩形;若宽高比均值大于预设的宽高比阈值,则对文本矩形进行旋转,获得待检测区域;若宽高比均值小于宽高比阈值,则将文本矩形作为待检测区域。
[0011]在上述的实现过程中,根据修正旋转角度对文本区域进行仿射变换,获得文本矩形,并通过多个文本区域的宽高比均值,判断是否需要对文本矩形进行旋转。以使获得的待检测区域均为可以直接输入识别网络的横向文本,提高图像处理准确率。
[0012]可选的,在本申请实施例中,在根据文本区域的修正旋转角度、区域宽度和区域高度,对文本区域进行方向校准,获得待检测区域之后,方法还包括:将待检测区域输入预设的方向分类模型中,获得每一待检测区域的方向分类结果;其中,方向分类模型是对预先采集的方向文本样本集进行训练获得的;根据方向分类结果对待检测区域进行文本正向校准。
[0013]在上述的实现过程中,将待检测区域输入预设的方向分类模型中,获得每一待检测区域的方向分类结果,通过二分类的方向分类模型对待检测区域的文本方向进行分类,根据分类结果进行文本方向校正,以使待检测区域均为水平且正向的文本,提高后续的识别准确率。
[0014]可选的,在本申请实施例中,在根据文本区域的修正旋转角度、区域宽度和区域高度,对文本区域进行方向校准,获得待检测区域之后,方法还包括:获得待检测图像对应的下单商品图像信息;对待检测区域进行文本识别,获得文本识别结果;将文本识别结果和下单商品图像信息进行比对,获得一致性检测结果,一致性检测结果表征待检测图像中的文本识别结果与下单商品图像信息是否一致。
[0015]在上述的实现过程中,通过经过方向校准和正向校准的待检测区域进行文本识别,获得文本识别结果,通过将文本识别结果和对应的下单商品图像信息进行比对,获得一致性检测结果,提高核对效率;同时改善了因为待检测区域方向错误导致的一致性检测准确率较低的问题,提高了一致性检测的准确性。
[0016]可选的,在本申请实施例中,从待检测图像中获得文本区域,包括:获得待检测图像,将待检测图像输入预设的实例分割模型,获得分割信息;根据分割信息,从待检测图像中分割出文本区域。
[0017]在上述的实现过程中,通过实例分割将待检测图像中的文本区域进行分割,不仅可以将不同模板不同位置的字段信息精准的分割出来,同时能较好的适应实例与实例存在重叠的情况。
[0018]第二方面,本申请实施例还提供了一种图像处理装置,包括:获取模块,用于从待检测图像中获得文本区域,每一文本区域包括旋转角度、区域宽度和区域高度;修正角度模块,用于根据多个文本区域的旋转角度以及预设的第一角度阈值,对文本区域的旋转角度进行修正,获得修正旋转角度;区域处理模块,用于根据文本区域的修正旋转角度、区域宽度和区域高度,对文本区域进行方向校准,获得待检测区域。
[0019]第三方面,本申请实施例还提供了一种电子设备,包括:处理器和存储器,存储器存储有处理器可执行的机器可读指令,机器可读指令被处理器执行时执行如上面描述的方法。
[0020]第四方面,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上面描述的方法。
[0021]采用本申请提供图像处理方法、装置、电子设备及存储介质,从待检测图像中获得文本区域,对文本区域的旋转角度进行修正,使得待检测图像中的各文本区域的方向一致;再根据修正旋转角度、区域宽度和区域高度,对文本区域进行方向校准,获得待检测区域,以使待检测区域为水平方向。由于待检测区域方向统一且水平,避免因为同一待检测图像中的文本区域的文本方向不一致导致的检测准确率较低的问题,提高了检测的准确性和效率。
附图说明
[0022]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像处理方法,其特征在于,包括:从待检测图像中获得文本区域,每一所述文本区域包括旋转角度、区域宽度和区域高度;根据多个所述文本区域的旋转角度以及预设的第一角度阈值,对所述文本区域的旋转角度进行修正,获得修正旋转角度;根据所述文本区域的修正旋转角度、区域宽度和区域高度,对所述文本区域进行方向校准,获得待检测区域。2.根据权利要求1所述的方法,其特征在于,根据多个所述文本区域的旋转角度以及预设的第一角度阈值,对所述文本区域的旋转角度进行修正,获得修正旋转角度,包括:根据多个所述文本区域的旋转角度,获得多个所述文本区域中旋转角度最大值和旋转角度最小值的差值;若所述差值大于所述第一角度阈值,则对所述旋转角度小于预设的第二角度阈值的所述文本区域的旋转角度进行修正,获得修正旋转角度。3.根据权利要求1所述的方法,其特征在于,根据所述文本区域的修正旋转角度、区域宽度和区域高度,对所述文本区域进行方向校准,获得待检测区域,包括:根据每一所述文本区域的区域宽度和区域高度,获得每一所述文本区域的宽高比;根据每一所述文本区域的宽高比,获得多个所述文本区域的宽高比均值;根据所述文本区域的修正旋转角度和所述宽高比均值,对所述文本区域进行方向校准,获得待检测区域。4.根据权利要求3所述的方法,其特征在于,根据所述文本区域的修正旋转角度和所述宽高比均值,对所述文本区域进行方向校准,获得待检测区域,包括:根据所述修正旋转角度对所述文本区域进行仿射变换,获得文本矩形;若所述宽高比均值大于预设的宽高比阈值,则对所述文本矩形进行旋转,获得所述待检测区域;若所述宽高比均值小于所述宽高比阈值,则将所述文本矩形作为所述待检测区域。5.根据权利要求1所述的方法,其特征在于,在根据所述文本区域的修正旋转角度、区域宽度和区域高度,对所述文本区域进行方向校准,获得待检测...

【专利技术属性】
技术研发人员:王渭君张奎徐亮项晨魏超郑辉
申请(专利权)人:上海识装信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1