一种基于卷积神经网络的工业字符识别方法技术

技术编号：15330459 阅读：177 留言：0更新日期：2017-05-16 13:55

本发明专利技术提出了一种基于卷积神经网络的工业字符识别方法，包括建立字符数据集，对字符数据集进行数据增强及预处理，建立CNN集成模型，所述模型包含3个不同的个体分类器，然后，利用模型进行训练，训练分为两步完成，第一步为离线训练，获取离线训练模型，第二步为在线训练，将离线训练模型用作初始化，进行特定生产线字符数据集的训练，获取在线训练模型；以及对目标图形进行预处理、字符定位和单个字符图像分割；将分割好的字符图像送入已训练好的在线训练模型中，得到CNN集成模型中三个分类器将单个目标图像分类为每个类别的概率值；采用投票的方式进行最终决策，得到测试数据的类别结果。本发明专利技术能够对不同生产线上的字符进行快速、高效的识别。

An industrial character recognition method based on convolutional neural network

The invention provides an industrial character recognition method based on convolutional neural network, including the establishment of character data set, data enhancement and preprocessing of character data set, a CNN integrated model, the model contains 3 different individual classifiers, then trained using model, training is divided into two steps, first step for off-line training, get offline training model, the second step for the online training, the off-line training model is used for initialization, specific production line character data set for training, online training and target model; graph preprocessing, character location and single character image segmentation; character image will divide into online training the model has been trained in three CNN classifiers integrated model for single target image classification probability for each category by investment value; Tickets are used to make final decisions and get the category results of the test data. The invention can quickly and efficiently recognize characters on different production lines.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于卷积神经网络的工业字符识别方法
本专利技术涉及图像识别
，尤其涉及一种工业字符识别方法。
技术介绍
现有的字符识别技术一般采用基于模版匹配或基于结构统计的算法。以字符图像灰度作为匹配信息，通过计算字符模板图像与目标图像子区域的灰度相关系数来度量匹配度；或利用字符本身的形态结构，如边缘、拐点、连通域等特征进行识别。还有一类是在建立字符图像的特征后，通过有监督的方式学习特征与目标类别之间的关系，建立从输入到预测输出的函数关系。专利文献1(中国专利公开号CN101436249A)公开了一种获得字符粗分类及细分类匹配模版的方法，用于手写字符识别系统。专利文献2(中国专利公开号CN103049750A)公开了一种采用边缘特征建立字符匹配模版的方法。专利文献3(中国专利公开号CN104820827A)公开了一种通过二值化、预处理、区域粗提取和分割等各个操作获取字符的单独图像与设定的模版进行相似性度量的匹配算法，用于电线电缆表面的点状字符识别。专利文献4(中国专利公开号CN105761351A)公开了一种基于结构特征的字符识别方法。专利文献5(中国专利公开号CN104871180A)公开了一种使用相同文本的多个图像改善文本辨识的方法用于改善文字识别效果。专利文献6(中国专利公开号CN105608453A)公开了一种能够对包括不同种类字符的复式记录的票据进行高精度识别的字符识别系统及字符识别方法。专利文献7(中国专利公开号CN103902956A)公开了一种基于神经网络的车牌照字符识别方法，以字符图像在X轴和Y轴上的投影为基本，对其做Fourier变换得到的...

【技术保护点】
一种基于卷积神经网络的工业字符识别方法，其特征在于：所述方法包括：建立字符数据集，所述字符数据集包括混合场景字符数据集和单一场景字符数据集；对所述字符数据集进行数据增强及预处理，其中，所述数据增强包括对字符图像进行一系列的变换和加干扰操作来进一步扩大数据集；建立CNN集成模型的核心思想是训练具有准确性和多样性的个体学习器，其中，个体学习器采用卷积神经网络，所述CNN集成模型共包含三个CNN结构：Net‑1、Net‑2、Net‑3，Net‑1包含3个由卷积层和下采样层重复堆叠的特征提取阶段和2个全连接层，采用Softmax层作为特征分类器，采用了多级特征融合的方式，将每一个特征提取层或特定某几个特征提取层的输出进行融合，共同输入全连接层，这样得到的集成特征向量传入分类器作为最终的特征提取结果；Net‑2也同样包含3个特征提取阶段，同样采用了多级特征融合，在Net‑2中所有的卷积层都采用3×3的卷积核；Net‑3的结构与Net‑2较为相似，但没有将多级特征共同输入全链接层；在建立了三个网络结构作为个体学习器后，对CNN集成模型进行训练，训练步骤如下：(1)从原始数据集中随机采样，产生三个随...

【技术特征摘要】
1.一种基于卷积神经网络的工业字符识别方法，其特征在于：所述方法包括：建立字符数据集，所述字符数据集包括混合场景字符数据集和单一场景字符数据集；对所述字符数据集进行数据增强及预处理，其中，所述数据增强包括对字符图像进行一系列的变换和加干扰操作来进一步扩大数据集；建立CNN集成模型的核心思想是训练具有准确性和多样性的个体学习器，其中，个体学习器采用卷积神经网络，所述CNN集成模型共包含三个CNN结构：Net-1、Net-2、Net-3，Net-1包含3个由卷积层和下采样层重复堆叠的特征提取阶段和2个全连接层，采用Softmax层作为特征分类器，采用了多级特征融合的方式，将每一个特征提取层或特定某几个特征提取层的输出进行融合，共同输入全连接层，这样得到的集成特征向量传入分类器作为最终的特征提取结果；Net-2也同样包含3个特征提取阶段，同样采用了多级特征融合，在Net-2中所有的卷积层都采用3×3的卷积核；Net-3的结构与Net-2较为相似，但没有将多级特征共同输入全链接层；在建立了三个网络结构作为个体学习器后，对CNN集成模型进行训练，训练步骤如下：(1)从原始数据集中随机采样，产生三个随机样本空间，确保这些采样空间与所涉及的原始数据集有微小差异；(2)轮流训练三个网络模型。采用上一步得到的三个样本空间分别训练Net-1，Net-2，Net-3，这样就得到了三个有差异的分类器；(3)一轮训练结束，返回步骤(1)继续执行随机采样操作及训练操作，直到达到预设的迭代次数或三个结构的误差分别收敛到一定值。然后保存权重，得到三个个体分类器；其中，训练分为两步完成，第一步为离线训练，获取离线训练模型，第二步为在线训练，将离线训练模型用作初始化，进行特定生产线字符数据集的训练，获取在线训练模型；以及对目标图形进行预处理、字符定位和单个字符图像分割；将分割好的字符图像送入已训练好的在线训练模型中，得到CNN集成模型中三个分类器将单个目标图像分类为每个类别的概...

【专利技术属性】
技术研发人员：吴晓军，张瑞，
申请(专利权)人：吴晓军，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人