一种基于交互式分割的低对比度冲压字符识别算法制造技术

技术编号:20725939 阅读:20 留言:0更新日期:2019-03-30 17:54
本发明专利技术涉及一种基于交互式分割的低对比度冲压字符识别算法,包括以下步骤:(1)交互式分割;(2)自适应倾斜校正;(3)闭环回路二值化:步骤(2)得到的校正图进行动态阈值调整,得到质量最高的二值化图像;(4)灰度投影及字符归一化:沿着图像水平或者垂直的方向上累加图像的灰度值,根据灰度投影图的山谷和山峰位置,定位并分割出单个冲压字符,所得的单个字符归一化到同一大小;(5)特征提取与识别:采用HOG特征提取容器,对上述所得的字符进行特征提取,将提取的特征输入到三层BP神经网络进行训练识别。本发明专利技术能够较好的解决液化石油气钢瓶低对比度冲压字符分割精确度不足与鲁棒性过低的问题,提高低对比度冲压字符的识别率。

【技术实现步骤摘要】
一种基于交互式分割的低对比度冲压字符识别算法
本专利技术涉及一种低对比度冲压字符识别算法,具体涉及一种基于交互式分割的低对比度冲压字符识别算法,可应用于液化石油气钢瓶表面低对比度冲压字符的识别,属于光学字符识别

技术介绍
液化石油气钢瓶的使用量巨大,其安全隐患问题一直是一个值得关注的问题。为防止使用超过规定期限、报废产品非法流入市场,必须加大液化石油气钢瓶质量检测的监管力度,按照国家标准定期对液化石油气钢瓶进行质量检测,及时停止使用不符合安全使用标准的钢瓶。目前市场上液化石油气钢瓶ID的存储方式主要有三种:RFID电子标签、二维码、冲压编号。RFID电子标签是塑料材质的,通过金属绳索悬挂在液化石油气钢瓶的护罩上,在使用的过程中容易出现电子标签的丢失、损坏。另外,在检验的过程中,由于需要对液化石油气钢瓶进行退火处理,RFID电子标签需要被取下,这个过程会导致重新安装RFID电子标签的时候出现安装错乱,最终导致无法对液化石油气钢瓶进行有效的监管。市场上采用的二维码是陶瓷材料制成的,其被固定于液化石油气钢瓶的护罩上,难以拆卸,不会出现二维码信息丢失的情况。但是由于采用的是陶瓷材料,在使用的过程中可能会出现损坏的现象,影响检验过程中信息的读取。而且,在检测的过程中需要对钢瓶进行抛丸处理,陶瓷材料的二维码很容易受到损坏,同样会造成信息读取的失败,无法对钢瓶进行有效监管。而采用液化石油气冲压字符ID编码及利用机器视觉技术识别冲压在护罩上的字符方式可以很好的解决上述存在的几个问题。因为钢瓶的ID是冲压在金属护罩上,所以在使用的过程中不会出现ID丢失、损坏的现象,并且在检验的过程中,抛丸和退火的工序不会对其造成影响,可以保证钢瓶ID保存的完整性,这样在使用过程中不会造成液化石油气钢瓶的信息丢失的现象。但是,由于冲压字符的颜色和钢瓶瓶罩的颜色基本一致,两者之间的对比度很低,对字符的分割造成了很大的困难。而且,由于液化石油气钢瓶在市场上长期使用,可能会出现油斑、手印、锈斑等干扰因素,这进一步加大了字符分割的难度。在液化石油气钢瓶回检的过程中,由于工业现场的恶劣性与复杂性,工业相机所获取的待识别图像背景包含各种各样的工业现场装置,而且局部容易受到严重的光照不均匀现象,这些再次降低了自动分割的稳定性和鲁棒性。因此,为解决上述技术问题,确有必要提供一种创新的基于交互式分割的低对比度冲压字符识别算法,以克服现有技术中的所述缺陷。
技术实现思路
为解决上述问题,本专利技术的目的在于提供一种的基于交互式分割的低对比度冲压字符识别算法,其能较好的解决液化石油气钢瓶低对比度冲压字符分割精确度不足与鲁棒性过低的问题,提高低对比度冲压字符的识别率。为实现上述目的,本专利技术采取的技术方案为:一种基于交互式分割的低对比度冲压字符识别算法,其包括以下几个步骤:(1)交互式分割:采用MeanShift图像分割算法分割输入图像,用户标记背景及包含字符的目标钢瓶,采用最大相似性估计方法进行同质化区域融合,最终分割出包含字符的液化石油气钢瓶,去除复杂背景干扰;(2)自适应倾斜校正:通过训练包含三层的卷积神经网络,该网络能够定位并提取理想的字符边缘;通过训练大量的倾斜图像,该网络能够实现对步骤步骤(1)的结果图进行自适应倾斜校正的目的;(3)闭环回路二值化:通过闭环回路,调整二维熵的动态范围,找出二维熵的最低值,其对应于最好的阈值化图像效果;(4)灰度投影及字符归一化:步骤(3)所得到的二值化图像进行灰度投影,根据灰度投影图的山谷和山峰位置,精确定位并分割出单个冲压字符,所得的单个字符归一化到同一大小;(5)特征提取与识别:采用HOG特征提取容器,对步骤(4)所得的字符进行特征提取,将提取的特征输入到三层BP神经网络进行训练识别。本专利技术的基于交互式分割的低对比度冲压字符识别算法进一步设置为:所述MeanShift图像分割算法将复杂的背景通过粗化提取整体信息,进而将图像分割;对属于同一物体的子区域,计算颜色直方图并进行相似性估计以实现子区域融合;将颜色直方图分为16*16*16=4096个区间,定义不同区域R和区域Q的相似性估计方法,计算公式如下:其中u表示直方图区间数,表示区间R的归一化颜色直方图,表示区间Q的归一化颜色直方图,p(R,Q)表示区域R,Q的相似性估计值。本专利技术的基于交互式分割的低对比度冲压字符识别算法进一步设置为:所述步骤(2)中,卷积神经网络包括卷积层,池化层和全连接层;该卷积神经网络具有参数共享和局部感知的功能,每个神经元对局部进行感知,然后在高层将局部的信息综合起来得到全局的信息。本专利技术的基于交互式分割的低对比度冲压字符识别算法进一步设置为:所述步骤(3)中,利用二维熵来显示阈值化后黑白像素的分布情况,进而调整控制回路;二维熵值越小,对应该图像质量越好,该时刻使用的阈值越好;二维熵的计算公式如下:本专利技术的基于交互式分割的低对比度冲压字符识别算法进一步设置为:所述步骤(4),先对自适应阈值后的输出图像进行水平投影,分割出单行字符,然后再进行垂直投影,分割出单个字符,之后将单个字符归一化为30*30像素大小;灰度投影法计算公式如下:其中M,N分别是图像宽度和高度;dst(x,y)表示需要进行灰度投影的图像,ph(y)表示水平投影函数,y=0,1,...N;Ph(y)表示垂直投影函数,x=0,1,...M。本专利技术的基于交互式分割的低对比度冲压字符识别算法还设置为:所述步骤(5),采用HOG特征提取器进行特征提取,特征的提取步骤如下:首先计算图像的梯度,计算公式如下:G(x,y)=I(x+1,y)-I(x-1,y)G(x,y)=I(x,y+1)-I(x,y-1)Gx(x,y),Gy(x,y)分别表示图像中像素点(x,y)在水平方向上和垂直方向上的梯度;像素点(x,y)处的梯度幅值和梯度方向计算公式如下:其中G(x,y)表示像素点(x,y)的梯度幅值,θ(x,y)表示像素点(x,y)的剃度方向;然后将输入图分成若干个mc×mc的单元,用9个区间统计每个单元中像素点的梯度,即将360°分为9个不同的方向块,将属于同一梯度方向区间的像素归为一个区间中;最后,将提取的特征输入到三层BP神经网络中进行训练识别,BP神经网络的输入层神经元个数为提取的特征维数,输出层神经元个数为分类数,隐含层神经元个数可由经验公式计算如下:其中式中,q表示隐藏层节点的数量,d表示字符特征的维数,l表示分类数目。与现有技术相比,本专利技术具有如下有益效果:本专利技术的基于交互式分割的低对比度冲压字符识别算法能较好的解决液化石油气钢瓶低对比度冲压字符分割精确度不足与鲁棒性过低的问题,提高低对比度冲压字符的识别率。【附图说明】图1是本专利技术的基于交互式分割的低对比度冲压字符识别算法的流程图。图2为交互式分割流程图。图3为三层卷积神经网络示意图。图4为闭环回路二值化图。图5为HOG特征提取过程图。图6为三层BP神经网络示意图。【具体实施方式】请参阅说明书附图1所示,本专利技术为一种基于交互式分割的低对比度冲压字符识别算法,其包括以下几个步骤:(1)交互式分割:采用MeanShift图像分割算法分割输入图像,用户标记背景及包含字符的目标钢瓶,采用最大相似性估计方法进行同质化本文档来自技高网
...

【技术保护点】
1.一种基于交互式分割的低对比度冲压字符识别算法,其特征在于:包括以下几个步骤:(1)交互式分割:采用MeanShift图像分割算法分割输入图像,用户标记背景及包含字符的目标钢瓶,采用最大相似性估计方法进行同质化区域融合,最终分割出包含字符的液化石油气钢瓶,去除复杂背景干扰;(2)自适应倾斜校正:通过训练包含三层的卷积神经网络,该网络能够定位并提取理想的字符边缘;通过训练大量的倾斜图像,该网络能够实现对步骤步骤(1)的结果图进行自适应倾斜校正的目的;(3)闭环回路二值化:通过闭环回路,调整二维熵的动态范围,找出二维熵的最低值,其对应于最好的阈值化图像效果;(4)灰度投影及字符归一化:步骤(3)所得到的二值化图像进行灰度投影,根据灰度投影图的山谷和山峰位置,精确定位并分割出单个冲压字符,所得的单个字符归一化到同一大小;(5)特征提取与识别:采用HOG特征提取容器,对步骤(4)所得的字符进行特征提取,将提取的特征输入到三层BP神经网络进行训练识别。

【技术特征摘要】
1.一种基于交互式分割的低对比度冲压字符识别算法,其特征在于:包括以下几个步骤:(1)交互式分割:采用MeanShift图像分割算法分割输入图像,用户标记背景及包含字符的目标钢瓶,采用最大相似性估计方法进行同质化区域融合,最终分割出包含字符的液化石油气钢瓶,去除复杂背景干扰;(2)自适应倾斜校正:通过训练包含三层的卷积神经网络,该网络能够定位并提取理想的字符边缘;通过训练大量的倾斜图像,该网络能够实现对步骤步骤(1)的结果图进行自适应倾斜校正的目的;(3)闭环回路二值化:通过闭环回路,调整二维熵的动态范围,找出二维熵的最低值,其对应于最好的阈值化图像效果;(4)灰度投影及字符归一化:步骤(3)所得到的二值化图像进行灰度投影,根据灰度投影图的山谷和山峰位置,精确定位并分割出单个冲压字符,所得的单个字符归一化到同一大小;(5)特征提取与识别:采用HOG特征提取容器,对步骤(4)所得的字符进行特征提取,将提取的特征输入到三层BP神经网络进行训练识别。2.如权利要求1所述的基于交互式分割的低对比度冲压字符识别算法,其特征在于:所述步骤(1)中,MeanShift图像分割算法具体为:将复杂的背景通过粗化提取整体信息,进而将图像分割;对属于同一物体的子区域,计算颜色直方图并进行相似性估计以实现子区域融合;将颜色直方图分为16*16*16=4096个区间,定义不同区域R和区域Q的相似性估计方法,计算公式如下:其中u表示直方图区间数,表示区间R的归一化颜色直方图,表示区间Q的归一化颜色直方图,p(R,Q)表示区域R,Q的相似性估计值。3.如权利要求1所述的基于交互式分割的低对比度冲压字符识别算法,其特征在于:所述步骤(1)中,卷积神经网络包括卷积层,池化层和全连接层;该卷积神经网络具有参数共享和局部感知的功能,每个神经元对局部进行感知,然后在高层将局部的信息综合起来得到...

【专利技术属性】
技术研发人员:游照林向忠钱淼胡旭东
申请(专利权)人:浙江理工大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1