当前位置: 首页 > 专利查询>中南大学专利>正文

一种基于BP神经网络的钢印字符识别方法技术

技术编号:23605459 阅读:47 留言:0更新日期:2020-03-28 06:21
本发明专利技术公开了一种基于BP神经网络的钢印字符识别方法,属于图像识别技术领域,通过布置在工业现场的工业相机对工件钢印进行拍照,采集图像;通过机器学习聚类算法对图像进行阈值分割,实现了良好的分割效果,解决了针对钢印图片传统单一阈值分割无法准确分割特征与字符背景的问题,同时将聚类算法应用字符分割当中,实现了图像中字符的自动分割,而图像的归一化处理则解决了工件在移动过程中可能存在位置的偏移,从而导致图像大小的变化问题,提高了钢印识别的准确率;同时利用神经网络实现了对钢印识别模型的训练,且其模型在测试集中取得良好的效果。

A method of steel stamp character recognition based on BP neural network

【技术实现步骤摘要】
一种基于BP神经网络的钢印字符识别方法
本专利技术属于图像识别
,具体涉及一种基于BP神经网络的钢印字符识别方法。
技术介绍
近年来,由于计算机技术以及传感技术的快速发展,传统工厂逐渐向智能化、无人化的方向发展,但是在大型铸件、铝件的加工过程中,其在锻压车间加工时,其工件表面温度可达上百摄氏度,从而无法通过传统的RFID(如二维码、传感器等等)识别技术自动识别,因此其产品物料钢印批号的录入则一般是通过人工手动录入,但是人工录入在批量多的情况下会存在录入速度慢、录入结果出错等问题,因此为实现工厂智能化升级、解决工厂物料自动识别存在的问题,亟需一种图像识别技术来实现对钢印字符的自动识别。目前,人们对钢印字符识别技术的研究还处于起步阶段,已有图像识别技术主要应用在车牌识别、OCR文字识别等领域较多,但是其无法有效解决在钢印字符背景与字符特征相似,光线分布不均匀等情况下,字符区域与背景区域的准确分割。中国专利CN102426649B公开了一种简单的高准确率的钢印字符自动识别方法,其主要通过双阈值分割与神经网络算法实现对字符的识别,但是双阈值方法其阈值设置自适应性能差,在光照不均匀的情况下无法准确将字符与背景分割,同时无法解决图像分割后噪声的干扰;在学术界,也有很多学者针对图像分割做出一系列的研究,乔晓艳等人提出了基于模糊C均值聚类算法的心脏扭转运动中心室壁轮廓的自动提取方法,其使用模糊均值聚类算法与预设阈值相结合,从而完成图像阈值分割;赵红丹等人提出一种基于K-means算法分割遥感图像阈值确定方法,应用聚类算法的聚类中心平均值作为图像分割阈值,实现对图像的分割;但上述方法只是对传统阈值分割算法的改进,本质上还是传统的单阈值分割,依然无法解决在光照分布不均匀情况下字符区域和背景区域的准确分割难题。
技术实现思路
针对现有技术中图像特征提取中图像阈值分割效果不佳,图像分割后存在噪点等问题,本专利技术的目的在于提供一种基于BP神经网络的钢印字符识别方法,本专利技术方法在图像分割处理部分从样本容量出发,利用聚类算法将样本分成若干族(数量应根据实际情况而定),利用族内样本数占总体样本数的比例从而将其划分为字符区域、背景区域,实现对图像的分割,实现了钢印识别在的光照不均匀、字符与背景相似等条件下图像的准确分割,以及对图像分割后可能存在的图像噪点应用连通域大小判别实现字符区域和噪声区域的识别,进而实现噪声的去除,再利用聚类算法将图片分割成单个字符,进行归一化处理后,作为神经网络的输入得到相应的神经网络识别模型,与传统的字符识别技术相比,本方法中的图像分割算法通过样本容量占比而不是传统单阈值或多阈值方法实现图像字符与背景区域的分割,克服了传统单阈值或多阈值方法无法在光照不均匀、字符区域与背景区域特征相似条件下准确分割的问题,同时增加了对图像分割后噪声点的去除步骤,增强了算法识别的鲁棒性,其实际识别效果好、识别速度快,具备在工业现场环境下应用的条件。为了达到上述目的,本专利技术提供以下技术方案:一种基于BP神经网络的钢印字符识别方法,包括以下步骤:S1.通过CCD相机采集钢印表面图片,并将其放入训练集中;S2.对训练集中的图片,通过灰度转换将RGB图像转换为灰度图;S3.对灰度变化后图像,进行图像预处理;S4.对预处理后的图像进行图像阈值分割,将字符区域与背景区域分离;S5.对阈值分割后的图像进行连通域标记,通过判定连通域的大小来删除图像中存在的噪点;S6.对删除噪声后的图像进行图像字符分割操作,将图像中的字符区域分割成单个字符图像;S7.对图像字符分割后的图像进行归一化处理,并将分割处理后的字符图像分别放入相应的0~9的字符文件夹中,将训练集中的图片重复上述步骤,并判断是否全部执行,若未执行完,则继续上述步骤;S8.若执行完毕,则将步骤S7中得到字符归一化处理后的字符图像以文件夹的名称作为训练标签放入BP神经网络中训练,得到BP神经网络训练的模型;S9.对实际测试图片,重复图片测试集中图片处理流程S1~S8,实现字符图片的分割与归一化处理,将处理后的图片放入BP神经网络训练的模型中进行钢印字符识别,得到相应的结果。在一个具体实施例中,所述步骤S2中灰度转换的具体操作为:通过读取图片像素点的R、G、B值,则其灰度值通过上述操作,将彩色图像转换为灰度图像。在一个具体实施例中,所述步骤S3中图像预处理的具体操作为:利用高斯滤波对图像进行平滑去噪,平滑的程度取决于标准差;其输出是领域像素的加权平均,离中心越近的像素权重越高。通过图像预处理后,灰度图像的平滑效果更柔和,而且边缘保留的也更好,从而为下一步的图像处理做好准备。在一个具体实施例中,所述步骤S4中图像阈值分割,通过机器学习聚类算法,将背景与钢印字符的灰度值分为两类,并分别将两个族内的灰度值分别重置为0与255,从而实现图像的阈值分割,其流程具体如下:步骤1:首先随机选取两个像素点的像数值作为初始均值向量{u1,u2},然后计算各像素点到各均值量的曼哈顿距离其中xi为初始均值,而xj则为图像中各像素点的像素值;步骤2:遍历图像像素点,比较像素点与初始均值的曼哈顿距离,若与初始均值u1接近,即曼哈顿距离值小,则划入C1族内,反之则划入c2族内;步骤3:计算两个族内的灰度值均值,并于初始向量{u1,u2,u3}相比,若其向量之差小于允许的误差值,则停止划分,等待下一步处理;反之则重复上述步骤,直至向量之差小于允许误差值;步骤4:分别计算u1,u2,u3点在整个图像内的占比,假设u1<u2<u3,根据图像预设背景区域大于70%,若u3占比大于70%,则认为u3为背景区域,将其族内点集灰度值置为0,其他两族置为1,反之,则认为u1,u3为背景区域,将其族内点集灰度值置为0,u2族点集置为1,完成图像阈值分割。在一个具体实施例中,所述步骤S5中删除图像中存在的噪点,具体操作为:噪点是表面坑洼造成的,通过连通域标记,确定阈值分割后的连通域个数,通过判定连通域面积大小从而可以判定哪些连通域是属于字符,哪些属于背景中,进而将属于背景的连通域删除,从而实现图像噪点的去除。在一个具体实施例中,所述步骤S6中图像字符分割操作,具体为:步骤1:计算0和255灰度值的占比,占比小的为字符区域,为减少字符识别特征向量的提取,将字符区域重置为255,背景区域重置为0,即若占比小的字符区域灰度值为0,则将该族内所有灰度值重置为255,则另外一族内重置为0;步骤2:根据字符个数k,随机选取k个图片中灰度值为255的坐标作为初始向量{u1,u2,…,uk},其中ui=(xi,yi)即为随机选取点的像素坐标;步骤3:遍历图中灰度值为255的坐标点,分别计算各点与初始均值的欧式距离,即其中xi,xj分别对应遍历的坐标点和初始均值;步骤4:计算出每点与初始向量中所有的均值向量的欧式距离,选取其中欧式距离最小的点,并将其划入相应本文档来自技高网
...

【技术保护点】
1.一种基于BP神经网络的钢印字符识别方法,其特征在于,包括以下步骤:/nS1.通过CCD相机采集钢印表面图片,并将其放入训练集中;/nS2.对训练集中的图片,通过灰度转换将RGB图像转换为灰度图;/nS3.对灰度变化后图像,进行图像预处理;/nS4.对预处理后的图像进行图像阈值分割,将字符区域与背景区域分离;/nS5.对阈值分割后的图像进行连通域标记,通过判定连通域的大小来删除图像中存在的噪点;/nS6.对删除噪声后的图像进行图像字符分割操作,将图像中的字符区域分割成单个字符图像;/nS7.对图像字符分割后的图像进行归一化处理,并将分割处理后的字符图像分别放入相应的0~9的字符文件夹中,将训练集中的图片重复上述步骤,并判断是否全部执行,若未执行完,则继续上述步骤;/nS8.若执行完毕,则将步骤S7中得到字符归一化处理后的字符图像以文件夹的名称作为训练标签放入BP神经网络中训练,得到BP神经网络训练的模型;/nS9.对实际测试图片,重复图片测试集中图片处理流程S1~S8,实现字符图片的分割与归一化处理,将处理后的图片放入BP神经网络训练的模型中进行钢印字符识别,得到相应的结果。/n

【技术特征摘要】
1.一种基于BP神经网络的钢印字符识别方法,其特征在于,包括以下步骤:
S1.通过CCD相机采集钢印表面图片,并将其放入训练集中;
S2.对训练集中的图片,通过灰度转换将RGB图像转换为灰度图;
S3.对灰度变化后图像,进行图像预处理;
S4.对预处理后的图像进行图像阈值分割,将字符区域与背景区域分离;
S5.对阈值分割后的图像进行连通域标记,通过判定连通域的大小来删除图像中存在的噪点;
S6.对删除噪声后的图像进行图像字符分割操作,将图像中的字符区域分割成单个字符图像;
S7.对图像字符分割后的图像进行归一化处理,并将分割处理后的字符图像分别放入相应的0~9的字符文件夹中,将训练集中的图片重复上述步骤,并判断是否全部执行,若未执行完,则继续上述步骤;
S8.若执行完毕,则将步骤S7中得到字符归一化处理后的字符图像以文件夹的名称作为训练标签放入BP神经网络中训练,得到BP神经网络训练的模型;
S9.对实际测试图片,重复图片测试集中图片处理流程S1~S8,实现字符图片的分割与归一化处理,将处理后的图片放入BP神经网络训练的模型中进行钢印字符识别,得到相应的结果。


2.根据权利要求1所述的基于BP神经网络的钢印字符识别方法,其特征在于,所述步骤S2中灰度转换的具体操作为:
通过读取图片像素点的R、G、B值,则其灰度值通过上述操作,将彩色图像转换为灰度图像。


3.根据权利要求1所述的基于BP神经网络的钢印字符识别方法,其特征在于,所述步骤S3中图像预处理的具体操作为:
利用高斯滤波对图像进行平滑去噪,平滑的程度取决于标准差;其输出是领域像素的加权平均,离中心越近的像素权重越高。


4.根据权利要求1所述的基于BP神经网络的钢印字符识别方法,其特征在于,所述步骤S4中图像阈值分割,通过机器学习聚类算法,将背景与钢印字符的灰度值分为两类,并分别将两个族内的灰度值分别重置为0与255,从而实现图像的阈值分割,其流程具体如下:
步骤1:首先随机选取两个像素点的像数值作为初始均值向量{u1,u2},然后计算各像素点到各均值量的曼哈顿距离
其中xi为初始均值,而xj则为图像中各像素点的像素值;
步骤2:遍历图像像素点,比较像素点与初始均值的曼哈顿距离,若与初始均值u1接近,即曼哈顿距离值小,则划入C1族内,反之则划入C2族内;
步骤3:计算两个族内的灰度值均值,并于初始向量{u1,u2,u3}相比,若其向量之差小于允许的误差值,则停止划分,等待下一步处理;反之则重复上述步骤,直至向量之差小于允许误差值;
步骤4:分别计算u1,u2,u3点在整个图像内的占比,假设u1<u2<u3,根据图像预设背景区域大于70%,若u3占比大于70%,则认为u3为背景区域,将其族内点集灰度值置为0,其他两族置为1,反之,则认为u1,u3为背景区域,将其族内点集灰度值置为0,u2族点集置为1,完成图像阈值分割。


5.根据权利要求1所述的基于BP神经网络的钢印字符识别方法,其特征在于,所述步骤S5中删除图像中存在的噪点,具体操作为:
噪点是表面坑洼造成的,通过连通域标记,确定阈值分割后的连通域个数,通过判定连通域面积大小从而可以判定哪些连通域是属于字符,哪些属于背景中,进而将属于背景的连通域删除,从而实现图像噪点的去除。


6.根据权利要求1所述的基于BP神经网络的钢印字符识别方法,其特征在于,所述步骤S6中图像字符分割操作,具体为:
步骤1:计算0和...

【专利技术属性】
技术研发人员:谭建平刘文邓积微桑艳伟
申请(专利权)人:中南大学
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1