图像处理方法、装置、设备和存储介质制造方法及图纸

技术编号:30322365 阅读:15 留言:0更新日期:2021-10-09 23:47
一种图像处理方法、图像处理装置、电子设备和计算机可读存储介质。图像处理方法包括:获得初始图像,初始图像包括至少一个目标对象;对初始图像进行处理以得到中间图像;利用区域检测模型对中间图像进行识别,以得到包括M个对象连通区域的连通图像;确定在连通图像中与M个对象连通区域分别对应的M个包围框;基于M个包围框,从初始图像中截取N个图像块,每个图像块包括至少一个目标对象;以及利用对象识别模型识别N个图像块,以得到初始图像中的目标对象。目标对象。目标对象。

【技术实现步骤摘要】
图像处理方法、装置、设备和存储介质


[0001]本公开的实施例涉及一种图像处理方法、图像处理装置、电子设备和计算机可读存储介质。

技术介绍

[0002]随着数字化技术的发展,可以利用文本识别技术等对文本图像进行识别,以获取文本图像记载的信息,例如利用OCR(Optical Character Recognition,光学字符识别)识别技术,将图片、照片上的文字内容,直接转换为可编辑的文本。然而,目前的文字识别算法的复杂度高、计算量大,因而对使用环境存在限制,只适用于在服务器等硬件配置较高的设备上执行,而在终端设备等硬件配置较低的设备上执行时会导致识别速度很慢甚至不能识别的问题,因而在终端设备离线的情况下不易进行文字识别。

技术实现思路

[0003]本公开至少一个实施例提供一种图像处理方法,包括:获得初始图像,初始图像包括至少一个目标对象;对初始图像进行处理以得到中间图像;利用区域检测模型对中间图像进行识别,以得到包括M个对象连通区域的连通图像;确定在连通图像中与M个对象连通区域分别对应的M个包围框;基于M个包围框,从初始图像中截取N个图像块,每个图像块包括至少一个目标对象;以及利用对象识别模型识别N个图像块,以得到初始图像中的目标对象,M和N均为正整数。
[0004]例如,在本公开一实施例提供的图像处理方法中,利用区域检测模型对中间图像进行识别,以得到包括M个对象连通区域的连通图像,包括:利用区域检测模型处理中间图像,得到包括多个初始对象连通区域的连通图像;对包括多个初始对象连通区域的连通图像进行形态学变换,以基于包括多个初始对象连通区域的连通图像得到包括M个对象连通区域的连通图像。
[0005]例如,在本公开一实施例提供的图像处理方法中,对初始图像进行处理以得到中间图像包括:将初始图像的尺寸由初始尺寸缩小至预定尺寸;对预定尺寸的初始图像进行二值化处理,得到中间图像。
[0006]例如,在本公开一实施例提供的图像处理方法中,确定在连通图像中与M个对象连通区域分别对应的M个包围框,包括:提取M个对象连通区域各自的轮廓信息;基于轮廓信息,确定M个对象连通区域各自的包围框。
[0007]例如,在本公开一实施例提供的图像处理方法中,基于M个包围框,从初始图像中截取N个图像块,包括:根据中间图像和初始图像之间的对应关系,基于M个包围框中的每个包围框,对应截取初始图像中的一个图像块,M与N相等;或者对M个包围框进行预定处理,得到N个处理后的包围框,并根据中间图像和初始图像之间的对应关系,基于每个处理后的包围框,对应截取初始图像中的一个图像块。
[0008]例如,在本公开一实施例提供的图像处理方法中,对M个包围框进行预定处理,包
括:对M个包围框进行评分,以得到M个包围框分别对应的质量分值;将质量分值小于分值阈值的包围框作为无效包围框,并删除无效包围框。
[0009]例如,在本公开一实施例提供的图像处理方法中,对M个包围框进行评分包括:针对M个包围框中的每个包围框执行以下操作:确定包围框的面积和位于包围框中的目标对象对应的像素的面积;基于像素的面积与包围框的面积的比例,确定包围框对应的质量分值。
[0010]例如,在本公开一实施例提供的图像处理方法中,对M个包围框进行预定处理,包括:将M个包围框中的一个或多个包围框放大第一预定倍数。
[0011]例如,在本公开一实施例提供的图像处理方法中,对M个包围框进行预定处理,还包括:检测M个包围框中每相邻两个包围框之间是否至少部分区域重叠,若是,将至少部分区域重叠的两个包围框中的每个包围框基于第二预定倍数进行缩小处理,以使得缩小后的两个包围框不重叠或者重叠区域减小。
[0012]例如,在本公开一实施例提供的图像处理方法中,利用对象识别模型识别N个图像块,以得到初始图像中的目标对象,包括:确定N个图像块中在第一方向上的长度大于识别长度阈值的P个第一图像块,并将每个第一图像块分割为至少两个子图像块,以得到与P个第一图像块对应的多个子图像块,每个子图像块的长度等于或小于识别长度阈值;以及利用对象识别模型识别多个子图像块,以得到P个第一图像块中的目标对象,初始图像中的目标对象包括P个第一图像块中的目标对象,P为正整数。
[0013]例如,在本公开一实施例提供的图像处理方法中,利用对象识别模型识别N个图像块,以得到初始图像中的目标对象,还包括:确定N个图像块中在第一方向上的长度小于识别长度阈值的Q个第二图像块,并对每个第二图像块进行处理,得到Q个处理后的第二图像块,每个处理后的第二图像块在第一方向上的长度为识别长度阈值;利用对象识别模型识别Q个处理后的第二图像块,以得到Q个第二图像块中的目标对象,初始图像中的目标对象还包括Q个第二图像块中的目标对象,Q为正整数。
[0014]例如,在本公开一实施例提供的图像处理方法中,将每个第一图像块分割为至少两个子图像块包括:针对N个图像块中的第i个第一图像块执行以下操作:在第一方向上,每间隔识别长度阈值设置一个候选分割点,以确定第i个第一图像块对应的至少一个候选分割点;基于至少一个候选分割点,确定第i个第一图像块对应的至少一个分割点;基于至少一个分割点,将第i个第一图像块分割为至少两个子图像块,i为小于等于P的正整数。
[0015]例如,在本公开一实施例提供的图像处理方法中,基于至少一个候选分割点,确定第i个第一图像块对应的至少一个分割点,包括:若在第i个第一图像块中的至少一个候选分割点中的任一候选分割点的距离阈值的范围内包含间隔区域,则将间隔区域中的一点作为第i个第一图像块对应的一个分割点;若在第i个第一图像块中的至少一个候选分割点中的任一候选分割点的距离阈值的范围内不包含间隔区域,则将任一候选分割点作为第i个第一图像块对应的一个分割点。
[0016]例如,在本公开一实施例提供的图像处理方法中,对每个第二图像块进行处理,包括:在第一方向上,在每个第二图像块的至少一端拼接端部图像块,以得到每个第二图像块对应的处理后的第二图像块,端部图像块中的每个像素的像素值与第二图像块中的每个对象对应的像素的像素值不同。
[0017]例如,在本公开一实施例提供的图像处理方法中,每个第一图像块包括多个目标对象,多个目标对象沿第一方向依次排列。
[0018]例如,在本公开一实施例提供的图像处理方法中,至少一个目标对象包括字符。
[0019]本公开一实施例提供一种图像处理装置,包括:图像获取模块,配置为获得初始图像,所述初始图像包括至少一个目标对象;图像处理模块,配置为对所述初始图像进行处理以得到中间图像;区域识别模块,配置为利用区域检测模型对所述中间图像进行识别,以得到包括M个对象连通区域的连通图像;确定模块,配置为在所述连通图像中确定与所述M个对象连通区域分别对应的M个包围框;截取模块,配置为基于所述M个包围框,从所述初始图像中截取N个图像块,每个所述图像块包括至少一个目标对象;以及对象识别模块,配置为利用对象识别模型识别所述N个图像块,以得到所述初始图像中的目标本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像处理方法,包括:获得初始图像,其中,所述初始图像包括至少一个目标对象;对所述初始图像进行处理以得到中间图像;利用区域检测模型对所述中间图像进行识别,以得到包括M个对象连通区域的连通图像;确定在所述连通图像中与所述M个对象连通区域分别对应的M个包围框;基于所述M个包围框,从所述初始图像中截取N个图像块,其中,每个所述图像块包括至少一个目标对象;以及利用对象识别模型识别所述N个图像块,以得到所述初始图像中的目标对象,其中,M和N均为正整数。2.根据权利要求1所述的方法,其中,利用区域检测模型对所述中间图像进行识别,以得到包括M个对象连通区域的连通图像,包括:利用所述区域检测模型处理所述中间图像,得到包括多个初始对象连通区域的连通图像;对所述包括多个初始对象连通区域的连通图像进行形态学变换,以基于所述包括多个初始对象连通区域的连通图像得到所述包括M个对象连通区域的连通图像。3.根据权利要求2所述的方法,其中,对所述初始图像进行处理以得到中间图像包括:将所述初始图像的尺寸由初始尺寸缩小至预定尺寸;对所述预定尺寸的初始图像进行二值化处理,得到所述中间图像。4.根据权利要求2所述的方法,其中,确定在所述连通图像中与所述M个对象连通区域分别对应的M个包围框,包括:提取所述M个对象连通区域各自的轮廓信息;基于所述轮廓信息,确定所述M个对象连通区域各自的包围框。5.根据权利要求1所述的方法,其中,基于所述M个包围框,从所述初始图像中截取N个图像块,包括:根据所述中间图像和所述初始图像之间的对应关系,基于所述M个包围框中的每个包围框,对应截取所述初始图像中的一个图像块,其中,M与N相等;或者对所述M个包围框进行预定处理,得到N个处理后的包围框,并根据所述中间图像和所述初始图像之间的对应关系,基于每个所述处理后的包围框,对应截取所述初始图像中的一个图像块。6.根据权利要求5所述的方法,其中,对所述M个包围框进行预定处理,包括:对所述M个包围框进行评分,以得到所述M个包围框分别对应的质量分值;将质量分值小于分值阈值的包围框作为无效包围框,并删除所述无效包围框。7.根据权利要求6所述的方法,其中,对所述M个包围框进行评分包括:针对所述M个包围框中的每个包围框执行以下操作:确定所述包围框的面积和位于所述包围框中的目标对象对应的像素的面积;基于所述像素的面积与所述包围框的面积的比例,确定所述包围框对应的质量分值。8.根据权利要求5所述的方法,其中,对所述M个包围框进行预定处理,包括:将所述M个包围框中的一个或多个包围框放大第一预定倍数。
9.根据权利要求6

8任一项所述的方法,其中,对所述M个包围框进行预定处理,还包括:检测所述M个包围框中每相邻两个包围框之间是否至少部分区域重叠,若是,将至少部分区域重叠的两个包围框中的每个包围框基于第二预定倍数进行缩小处理,以使得缩小后的两个包围框不重叠或者重叠区域减小。10.根据权利要求1

6任一项所述的方法,其中,利用对象识别模型识别所述N个图像块,以得到所述初始图像中的目标对象,包括:确定所述N个图像块中在第一方向上的长度大于识别长度阈值的P个第一图像块,并将每个所述第一图像块分割为至少两个子图像块,以得到与所述P个第一图像块对应的多个子图像块,其中,每个所述子图像块的长度等于或小于所述识别长度阈值;以及利用所述对象识别模型识别所述多个子图像块,以得到所述P个第一图像块中的目标对象,其中,所述初始图像中的目标...

【专利技术属性】
技术研发人员:徐青松李青
申请(专利权)人:杭州睿胜软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1