一种文字定位框的确定方法、装置、介质及电子设备制造方法及图纸

技术编号:26971775 阅读:36 留言:0更新日期:2021-01-06 00:03
本申请实施例公开了一种文字定位框的确定方法、装置、介质及电子设备。所述方法包括:获取切片图像,对所述切片图像进行预处理,得到预处理图像;采用连通域分析算法,确定所述预处理图像的文字区域;根据所述切片图像中各文字区域,确定文字定位框的位置。执行本方案,可以直接根据所确定的文字定位框位置,调整外接方框的坐标,使外接方框更加贴近文字本身,进而利用新的外接方框截取优化后的切片图像,作为下一步文字识别的输入,无需重新标注和重新训练的环节,提高了文字识别效率。

【技术实现步骤摘要】
一种文字定位框的确定方法、装置、介质及电子设备
本申请实施例涉及图像处理
,尤其涉及一种文字定位框的确定方法、装置、介质及电子设备。
技术介绍
近年来,随着经济的快速发展,图像处理技术的应用越来越广泛。大到卫星图像识别,小到社区视频监控,都离不开对图像处理的技术的应用。而在一些场景中,需要对图像中的文字进行定位,例如用来识别文本内容,或者确定票据是否符合规定等等。现有技术中,基于深度学习的图像识别技术一般包括文字定位、文字识别两个步骤。文字识别的效果依赖于文字定位结果的准确性,若文字定位结果的文本外接方框过大时,方框内的空白部分比例过大,会导致识别结果不够准确。目前采用的方法是对文字定位模型的数据进行重新标注,并对重新训练模型,但效率较低。
技术实现思路
本申请实施例提供一种文字定位框的确定方法、装置、介质及电子设备,可以利用连通域分析的方法对文字定位框进行确定,得到更加精确的坐标,以提高文字识别的准确率。并且,可以直接根据所确定的文字定位框位置,调整外接方框的坐标,使外接方框更加贴近文字本身,进而利用新的外接方框截取本文档来自技高网...

【技术保护点】
1.一种文字定位框的确定方法,其特征在于,所述方法包括:/n获取切片图像,对所述切片图像进行预处理,得到预处理图像;/n采用连通域分析算法,确定所述预处理图像的文字区域;/n根据所述切片图像中各文字区域,确定文字定位框的位置。/n

【技术特征摘要】
1.一种文字定位框的确定方法,其特征在于,所述方法包括:
获取切片图像,对所述切片图像进行预处理,得到预处理图像;
采用连通域分析算法,确定所述预处理图像的文字区域;
根据所述切片图像中各文字区域,确定文字定位框的位置。


2.根据权利要求1所述的方法,其特征在于,对所述切片图像进行预处理,得到预处理图像,包括:
对所述切片图像进行转灰度图处理,得到切片图像灰度图;以及,对所述切片图像进行均值滤波处理,得到均值滤波结果;
根据所述切片图像灰度图与所述均值滤波结果,确定重置颜色切片图像。


3.根据权利要求2所述的方法,其特征在于,在确定重置颜色切片图像之后,所述方法还包括:
对所述重置颜色切片图像进行二值化处理,得到二值化图像。


4.根据权利要求3所述的方法,其特征在于,所述二值化图像中,背景像素点设置为黑色,前景像素点设置为白色。


5.根据权利要求1所述的方法,其特征在于,采用连通域分析算法,确定所述预处理图像的文字区域,包括:
计算所述预处理图像中位置相邻的具有前景像素点像素值的连通区域,确定为所述切片图像的文字区域。


6.根据权利要求5所述的方法,其特征在于,各文字区域以矩形坐标数据的四个分量进行存储;其中:
第一分量为矩形的左上角横坐标;
第二分量为矩形的左上角纵坐标;
第三分量为矩形的宽度;
第四分量为矩形的高度。


7.根据权利要求5所述的方法,其特征在于,在计算所述预处理图像中位置相邻的具有前景像素点像素值的连通区域,确定为所述切片图像的文字区域之前,所述方法还包括:
判断各文字区域构成的文字排列方向是否为水...

【专利技术属性】
技术研发人员:胡雅伦陆登强万光明车越云
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1