【技术实现步骤摘要】
图像处理方法、装置、设备和存储介质
[0001]本公开的实施例涉及一种图像处理方法、图像处理装置、电子设备和计算机可读存储介质。
技术介绍
[0002]随着数字化技术的发展,可以利用文本识别技术等对文本图像进行识别,以获取文本图像记载的信息,例如利用OCR(Optical Character Recognition,光学字符识别)识别技术,将图片、照片上的文字内容,直接转换为可编辑的文本。然而,目前的文字识别算法的复杂度高、计算量大,因而对使用环境存在限制,只适用于在服务器等硬件配置较高的设备上执行,而在终端设备等硬件配置较低的设备上执行时会导致识别速度很慢甚至不能识别的问题,因而在终端设备离线的情况下不易进行文字识别。
技术实现思路
[0003]本公开至少一个实施例提供一种图像处理方法,包括:获得初始图像,初始图像包括至少一个目标对象;对初始图像进行处理以得到中间图像;利用区域检测模型对中间图像进行识别,以得到包括M个对象连通区域的连通图像;确定在连通图像中与M个对象连通区域分别对应的M个包围框;基于M个包围框,从初始图像中截取N个图像块,每个图像块包括至少一个目标对象;以及利用对象识别模型识别N个图像块,以得到初始图像中的目标对象,M和N均为正整数。
[0004]例如,在本公开一实施例提供的图像处理方法中,利用区域检测模型对中间图像进行识别,以得到包括M个对象连通区域的连通图像,包括:利用区域检测模型处理中间图像,得到包括多个初始对象连通区域的连通图像;对包括多个初始对象连通区域的连通图像 ...
【技术保护点】
【技术特征摘要】
1.一种图像处理方法,包括:获得初始图像,其中,所述初始图像包括至少一个目标对象;对所述初始图像进行处理以得到中间图像;利用区域检测模型对所述中间图像进行识别,以得到包括M个对象连通区域的连通图像;确定在所述连通图像中与所述M个对象连通区域分别对应的M个包围框;基于所述M个包围框,从所述初始图像中截取N个图像块,其中,每个所述图像块包括至少一个目标对象;以及利用对象识别模型识别所述N个图像块,以得到所述初始图像中的目标对象,其中,M和N均为正整数。2.根据权利要求1所述的方法,其中,利用区域检测模型对所述中间图像进行识别,以得到包括M个对象连通区域的连通图像,包括:利用所述区域检测模型处理所述中间图像,得到包括多个初始对象连通区域的连通图像;对所述包括多个初始对象连通区域的连通图像进行形态学变换,以基于所述包括多个初始对象连通区域的连通图像得到所述包括M个对象连通区域的连通图像。3.根据权利要求2所述的方法,其中,对所述初始图像进行处理以得到中间图像包括:将所述初始图像的尺寸由初始尺寸缩小至预定尺寸;对所述预定尺寸的初始图像进行二值化处理,得到所述中间图像。4.根据权利要求2所述的方法,其中,确定在所述连通图像中与所述M个对象连通区域分别对应的M个包围框,包括:提取所述M个对象连通区域各自的轮廓信息;基于所述轮廓信息,确定所述M个对象连通区域各自的包围框。5.根据权利要求1所述的方法,其中,基于所述M个包围框,从所述初始图像中截取N个图像块,包括:根据所述中间图像和所述初始图像之间的对应关系,基于所述M个包围框中的每个包围框,对应截取所述初始图像中的一个图像块,其中,M与N相等;或者对所述M个包围框进行预定处理,得到N个处理后的包围框,并根据所述中间图像和所述初始图像之间的对应关系,基于每个所述处理后的包围框,对应截取所述初始图像中的一个图像块。6.根据权利要求5所述的方法,其中,对所述M个包围框进行预定处理,包括:对所述M个包围框进行评分,以得到所述M个包围框分别对应的质量分值;将质量分值小于分值阈值的包围框作为无效包围框,并删除所述无效包围框。7.根据权利要求6所述的方法,其中,对所述M个包围框进行评分包括:针对所述M个包围框中的每个包围框执行以下操作:确定所述包围框的面积和位于所述包围框中的目标对象对应的像素的面积;基于所述像素的面积与所述包围框的面积的比例,确定所述包围框对应的质量分值。8.根据权利要求5所述的方法,其中,对所述M个包围框进行预定处理,包括:将所述M个包围框中的一个或多个包围框放大第一预定倍数。
9.根据权利要求6
‑
8任一项所述的方法,其中,对所述M个包围框进行预定处理,还包括:检测所述M个包围框中每相邻两个包围框之间是否至少部分区域重叠,若是,将至少部分区域重叠的两个包围框中的每个包围框基于第二预定倍数进行缩小处理,以使得缩小后的两个包围框不重叠或者重叠区域减小。10.根据权利要求1
‑
6任一项所述的方法,其中,利用对象识别模型识别所述N个图像块,以得到所述初始图像中的目标对象,包括:确定所述N个图像块中在第一方向上的长度大于识别长度阈值的P个第一图像块,并将每个所述第一图像块分割为至少两个子图像块,以得到与所述P个第一图像块对应的多个子图像块,其中,每个所述子图像块的长度等于或小于所述识别长度阈值;以及利用所述对象识别模型识别所述多个子图像块,以得到所述P个第一图像块中的目标对象,其中,所述初始图像中的目标...
【专利技术属性】
技术研发人员:徐青松,李青,
申请(专利权)人:杭州睿胜软件有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。