一种文字定位框的确定方法、装置、介质及电子设备制造方法及图纸

技术编号:26971775 阅读:28 留言:0更新日期:2021-01-06 00:03
本申请实施例公开了一种文字定位框的确定方法、装置、介质及电子设备。所述方法包括:获取切片图像,对所述切片图像进行预处理,得到预处理图像;采用连通域分析算法,确定所述预处理图像的文字区域;根据所述切片图像中各文字区域,确定文字定位框的位置。执行本方案,可以直接根据所确定的文字定位框位置,调整外接方框的坐标,使外接方框更加贴近文字本身,进而利用新的外接方框截取优化后的切片图像,作为下一步文字识别的输入,无需重新标注和重新训练的环节,提高了文字识别效率。

【技术实现步骤摘要】
一种文字定位框的确定方法、装置、介质及电子设备
本申请实施例涉及图像处理
,尤其涉及一种文字定位框的确定方法、装置、介质及电子设备。
技术介绍
近年来,随着经济的快速发展,图像处理技术的应用越来越广泛。大到卫星图像识别,小到社区视频监控,都离不开对图像处理的技术的应用。而在一些场景中,需要对图像中的文字进行定位,例如用来识别文本内容,或者确定票据是否符合规定等等。现有技术中,基于深度学习的图像识别技术一般包括文字定位、文字识别两个步骤。文字识别的效果依赖于文字定位结果的准确性,若文字定位结果的文本外接方框过大时,方框内的空白部分比例过大,会导致识别结果不够准确。目前采用的方法是对文字定位模型的数据进行重新标注,并对重新训练模型,但效率较低。
技术实现思路
本申请实施例提供一种文字定位框的确定方法、装置、介质及电子设备,可以利用连通域分析的方法对文字定位框进行确定,得到更加精确的坐标,以提高文字识别的准确率。并且,可以直接根据所确定的文字定位框位置,调整外接方框的坐标,使外接方框更加贴近文字本身,进而利用新的外接方框截取优化后的切片图像,作为下一步文字识别的输入,无需重新标注和重新训练的环节,提高了文字识别效率。第一方面,本申请实施例提供了一种文字定位框的确定方法,所述方法包括:获取切片图像,对所述切片图像进行预处理,得到预处理图像;采用连通域分析算法,确定所述预处理图像的文字区域;根据所述切片图像中各文字区域,确定文字定位框的位置。进一步的,对所述切片图像进行预处理,得到预处理图像,包括:对所述切片图像进行转灰度图处理,得到切片图像灰度图;以及,对所述切片图像进行均值滤波处理,得到均值滤波结果;根据所述切片图像灰度图与所述均值滤波结果,确定重置颜色切片图像。进一步的,在确定重置颜色切片图像之后,所述方法还包括:对所述重置颜色切片图像进行二值化处理,得到二值化图像。进一步的,所述二值化图像中,背景像素点设置为黑色,前景像素点设置为白色。进一步的,采用连通域分析算法,确定所述预处理图像的文字区域,包括:计算所述预处理图像中位置相邻的具有前景像素点像素值的连通区域,确定为所述切片图像的文字区域。进一步的,各文字区域以矩形坐标数据的四个分量进行存储;其中:第一分量为矩形的左上角横坐标;第二分量为矩形的左上角纵坐标;第三分量为矩形的宽度;第四分量为矩形的高度。进一步的,在计算所述预处理图像中位置相邻的具有前景像素点像素值的连通区域,确定为所述切片图像的文字区域之前,所述方法还包括:判断各文字区域构成的文字排列方向是否为水平方向或为垂直方向;若否,则根据各文字区域的中心点确定文字排列方向的斜率;根据所述斜率进行方向校正,以得到水平方向或垂直方向的文字排列。进一步的,根据所述切片图像中各文字区域,确定文字定位框的位置,包括:确定各文字区域中的高度最高的文字区域;根据所述高度最高的文字区域的上边界和下边界,确定文字定位框左上角纵坐标和文字定位框高度;确定各文字区域中的最左侧文字区域和最右侧文字区域;根据所述最左侧文字区域的左边界确定文字定位框左上角横坐标;以及,根据最右侧文字区域的右边界和最左侧文字区域的左边界确定文字定位框宽度。进一步的,在根据所述切片图像中各文字区域,确定文字定位框的位置之后,所述方法还包括:根据所确定的文字定位框,截取优化后的切片图像,作为文字识别的输入数据。第二方面,本申请实施例提供了一种文字定位框的确定装置,所述装置包括:预处理图像生成模块,用于获取切片图像,对所述切片图像进行预处理,得到预处理图像;文字区域确定模块,用于采用连通域分析算法,确定所述预处理图像的文字区域;文字定位框位置确定模块,用于根据所述切片图像中各文字区域,确定文字定位框的位置。第三方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请实施例所述的文字定位框的确定方法。第四方面,本申请实施例提供了一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器运行的计算机程序,所述处理器执行所述计算机程序时实现如本申请实施例所述的文字定位框的确定方法。本申请实施例所提供的技术方案,获取切片图像,对所述切片图像进行预处理,得到预处理图像;采用连通域分析算法,确定所述预处理图像的文字区域;根据所述切片图像中各文字区域,确定文字定位框的位置。本申请所提供的技术方案,可以直接根据所确定的文字定位框位置,调整外接方框的坐标,使外接方框更加贴近文字本身,进而利用新的外接方框截取优化后的切片图像,作为下一步文字识别的输入。附图说明图1是本申请实施例提供的文字定位框的确定方法的流程图;图2是本申请实施例提供的切片图像灰度图的示意图;图3是本申请实施例提供的切片图像均值滤波结果的示意图;图4是本申请实施例提供的重新设置颜色后的切片图像的示意图;图5是本申请实施例提供的重新设置颜色后的切片图像的二值化效果图;图6是本申请实施例提供的文字区域的示意图;图7是本申请实施例提供的重新计算前的文字定位框的示意图;图8是本申请实施例提供的重新计算后的文字定位框的示意图;图9是本申请实施例提供的文字定位框的确定装置的结构示意图;图10是本申请实施例提供的一种电子设备的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。图1是本申请实施例提供的文字定位框的确定方法的流程图,本实施例可适用于图像识别的情况,该方法可以由本申请实施例所提供的文字定位框的确定装置执行,该装置可以由软件和/或硬件的方式来实现,并可集成于智能终端等电子设备中。本方案基于深度学习的图像识别技术一般包括文字定位、文字识别两个步骤。文字识别的效果依赖于文字定位结果的准确性,若文字定位结果(文本的外接方框)过大时,方框内的空白部分比例过大,会导致识别结果不够准确。目前采用的方法是对文字定位模型的数据进行重新标注,并对重新训练模型,但效率较低。本专利技术提供的技术方案,旨在利用连通域分析的方法对文字定位框进行优化,调整为更加精确的坐标,以提高本文档来自技高网...

【技术保护点】
1.一种文字定位框的确定方法,其特征在于,所述方法包括:/n获取切片图像,对所述切片图像进行预处理,得到预处理图像;/n采用连通域分析算法,确定所述预处理图像的文字区域;/n根据所述切片图像中各文字区域,确定文字定位框的位置。/n

【技术特征摘要】
1.一种文字定位框的确定方法,其特征在于,所述方法包括:
获取切片图像,对所述切片图像进行预处理,得到预处理图像;
采用连通域分析算法,确定所述预处理图像的文字区域;
根据所述切片图像中各文字区域,确定文字定位框的位置。


2.根据权利要求1所述的方法,其特征在于,对所述切片图像进行预处理,得到预处理图像,包括:
对所述切片图像进行转灰度图处理,得到切片图像灰度图;以及,对所述切片图像进行均值滤波处理,得到均值滤波结果;
根据所述切片图像灰度图与所述均值滤波结果,确定重置颜色切片图像。


3.根据权利要求2所述的方法,其特征在于,在确定重置颜色切片图像之后,所述方法还包括:
对所述重置颜色切片图像进行二值化处理,得到二值化图像。


4.根据权利要求3所述的方法,其特征在于,所述二值化图像中,背景像素点设置为黑色,前景像素点设置为白色。


5.根据权利要求1所述的方法,其特征在于,采用连通域分析算法,确定所述预处理图像的文字区域,包括:
计算所述预处理图像中位置相邻的具有前景像素点像素值的连通区域,确定为所述切片图像的文字区域。


6.根据权利要求5所述的方法,其特征在于,各文字区域以矩形坐标数据的四个分量进行存储;其中:
第一分量为矩形的左上角横坐标;
第二分量为矩形的左上角纵坐标;
第三分量为矩形的宽度;
第四分量为矩形的高度。


7.根据权利要求5所述的方法,其特征在于,在计算所述预处理图像中位置相邻的具有前景像素点像素值的连通区域,确定为所述切片图像的文字区域之前,所述方法还包括:
判断各文字区域构成的文字排列方向是否为水...

【专利技术属性】
技术研发人员:胡雅伦陆登强万光明车越云
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1