一种图像检测方法、装置、存储介质及设备制造方法及图纸

技术编号:33022212 阅读:24 留言:0更新日期:2022-04-15 08:55
本申请公开了一种图像检测方法、装置、存储介质及设备,该方法包括:首先对获取到的目标图像进行检测,得到包含文本行位置的二值图和包含单字位置的二值图,然后对包含文本行位置的二值图中的文本行进行标记,得到各个文本行对应的标识;并确定各个文本行所在位置中各个像素点的坐标值,以及计算包含单字位置的二值图中各个单字所在位置的中心位置的像素点坐标值;接着,将各个单字所在位置的中心位置的像素点坐标值与各个文本行所在位置中各个像素点的坐标值进行匹配,确定各个单字所属的文本行标识,进而可以将各个单字填充到对应标识的文本行中,以实现文本行所在位置和单字所在位置的精准匹配,从而提高了检测结果的准确性和检测效率。性和检测效率。性和检测效率。

【技术实现步骤摘要】
一种图像检测方法、装置、存储介质及设备


[0001]本申请涉及图像处理
,尤其涉及一种图像检测方法、装置、存储介质及设备。

技术介绍

[0002]随着人工智能(Artificial Intelligence,简称AI)技术的不断突破和发展。对于光学字符识别(Optical Character Recognition,简称OCR)识别技术的需求也逐渐增加。其中,多粒度OCR检测指的是对一幅图像中的文字同时检测文本行和单字,相当于同时检测出文本行位置信息和单字位置信息。由于有些业务场景中既需要文本行的信息,也需要单字的信息。因此,如何将文本行位置和单字位置进行准确匹配和整合是目前相关领域比较重要的问题。
[0003]目前在进行多粒度OCR检测时,对于文本行位置和单字位置进行匹配和整合的方法通常采用的是基于文本行位置和单字位置的交并比(Intersection

over

Union,简称IOU)分组方案,从数学中的集合角度来讲,如图1所示,IOU指的是利用两个区域的交集除以两个区域的并集,并根据比本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种图像检测方法,其特征在于,所述方法包括:获取待检测的目标图像;并对所述目标图像进行检测,得到包含文本行位置的二值图和包含单字位置的二值图;对所述包含文本行位置的二值图中的文本行进行标记,得到各个文本行对应的标识;并确定各个文本行所在位置中各个像素点的坐标值;计算所述包含单字位置的二值图中各个单字所在位置的中心位置的像素点坐标值;将所述各个单字所在位置的中心位置的像素点坐标值与所述各个文本行所在位置中各个像素点的坐标值进行匹配,确定所述各个单字所属的文本行标识;将所述各个单字填充到对应标识的文本行中,实现文本行所在位置和单字所在位置的匹配,得到所述目标图像中文字的检测结果。2.根据权利要求1所述的方法,其特征在于,所述计算所述包含单字位置的二值图中各个单字所在位置的中心位置的像素点坐标值,包括:在所述包含单字位置的二值图所在坐标系中,计算各个单字所在位置的各个像素点坐标值;计算所述各个像素点坐标值的平均值,作为对应单字的中心位置的像素点坐标值。3.根据权利要求1所述的方法,其特征在于,所述计算所述包含单字位置的二值图中各个单字所在位置的中心位置的像素点坐标值,包括:在所述包含单字位置的二值图所在坐标系中,计算各个单字所在位置的各个像素点坐标值;计算所述各个像素点坐标值的平均值,作为对应单字的中心位置的初选像素点的坐标值;根据所述初选像素点的坐标值,确定对应单字的中心位置预设区域N个像素点的坐标值,作为对应单字的中心位置的像素点坐标值;所述N为大于1的正整数。4.根据权利要求2所述的方法,其特征在于,所述将所述各个单字所在位置的中心位置的像素点坐标值与所述各个文本行所在位置中各个像素点的坐标值进行匹配,确定所述各个单字所属的文本行标识,包括:计算所述各个单字所在位置的中心位置的像素点坐标值与所述各个文本行所在位置中各个像素点的坐标值之间的差值;若所述差值低于预设差值阈值,则将所述差值对应的文本行所在位置中的像素点作为与对应单字所在位置的中心位置的像素点匹配成功的像素点,并将所述匹配成功的像素点所在文本行的标识作为对应单字所属的文本行标识。5.根据权利要求3所述的方法,其特征在于,所述将所述各个单字所在位置的中心位置的像素点坐标值与所述各个文本行所在位置中各个像素点的坐标值进行匹配,确定所述各个单字所属的文本行标识,包括:计算所述N个像素点的坐标值与所述各个文...

【专利技术属性】
技术研发人员:石威林丽黄灿王长虎
申请(专利权)人:北京有竹居网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1