一种基于深度学习的计算机视觉0-O识别方法技术

技术编号：20390743 阅读：19 留言：0更新日期：2019-02-20 03:11

本发明专利技术公开了一种一种基于深度学习的计算机视觉0‑O识别方法，包含以下步骤：步骤一：图片预处理，对原始数据集进行二值化、水平切割、垂直切割从而得到训练样本，并且为训练样本打标签，制作tfrecord数据集；步骤二：通过CNN网络，从每个训练样本图片提取特征向量；步骤三：将步骤二得到的神经元填充到一个SoftMax函数，输出每一个类别条件概率，用于识别0‑O。本发明专利技术准确率高且训练时间短。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的计算机视觉0-O识别方法
本专利技术涉及一种0-O识别方法，特别是一种基于深度学习的计算机视觉0-O识别方法。
技术介绍
特征很重要。在深度学习方法出现之前，基于传统的手工设计特征(HandcraftFeatures)，包括基于连通区域，以及基于HOG的检测框描述的方法是比较主流的；如通过最大稳定极值区域(MSER-MaximallyStableExtremalRegions)得到字符的候选，并将这些字符候选看作连通图(graph)的顶点，此时就可以将文本行的寻找过程视为聚类(clustering)的过程，因为来自相同文本行的文本通常具有相同的方向、颜色、字体以及形状。传统方法对于图片的一个预处理：对包含字符的图像进行处理以便后续进行特征提取、学习。这个过程的主要目的是减少图像中的无用信息，以便方便后面的处理。在这个步骤通常有：灰度化(如果是彩色图像)、降噪、二值化、字符切分以及归一化这些子步骤。经过二值化后，图像只剩下两种颜色，即黑和白，其中一个是图像背景，另一个颜色就是要识别的字符了。降噪在这个阶段非常重要，降噪算法的好坏对特征提取的影响很大。字符切分则是将图像中的字符分割成单个字符——识别的。如果字符行有倾斜的话往往还要进行倾斜校正。归一化则是将单个的字符图像规整到同样的尺寸，在同一个规格下，才能应用统一的算法。特征提取(方法多种多样例如pca、sift等等)：特征是用来识别字符的关键信息，每个不同的字符都能通过特征来和其他字符进行区分。对于数字和英文字母来说，这个特征提取是比较容易的，因为数字只有10个，英文字母只有52个，都是小...

【技术保护点】
1.一种基于深度学习的计算机视觉0‑O识别方法，其特征在于包含以下步骤：步骤一：图片预处理，对原始数据集进行二值化、水平切割、垂直切割从而得到训练样本，并且为训练样本打标签，制作tfrecord数据集；步骤二：通过CNN网络，从每个训练样本图片提取特征向量；步骤三：将步骤二得到的神经元填充到一个SoftMax函数，输出每一个类别条件概率，用于识别0‑O。

【技术特征摘要】
1.一种基于深度学习的计算机视觉0-O识别方法，其特征在于包含以下步骤：步骤一：图片预处理，对原始数据集进行二值化、水平切割、垂直切割从而得到训练样本，并且为训练样本打标签，制作tfrecord数据集；步骤二：通过CNN网络，从每个训练样本图片提取特征向量；步骤三：将步骤二得到的神经元填充到一个SoftMax函数，输出每一个类别条件概率，用于识别0-O。2.按照权利要求1所述的一种基于深度学习的计算机视觉0-O识别方法，其特征在于：所述步骤一具体为1.1提供的原始图片不复杂，只需要进行二值化处理，并把需要的数字0和字母O从原始图片上进行垂直切割，再对切割出来的字符样本进行水平切割，切除多余的背景部分；1.2对分割出来的0-O样本图片进行标签标注并制作成tfrecord数据集。3.按照权利要求2所述的一种基于深度学习的计算机视觉0-O识别方法，其特征在于：所述1.1中垂直切割和水平切割的具体过程为基于像素点的分布，对每张二值化后的原始图片，分别从左到右扫描每一列中的上到下的每个像素点，当扫描每一列中扫描到了有像素点的变化即从无到有像素点，则对这一列的坐标进行一个标记1，再继续扫描，当又扫描到了有像素点的变化即从有到无像素点，我们再对这一列进行一个标记2，然后我们把标记1及标记2之间的区域进行分割出来，从而分割出原始图片的每个字符了，因为原始图片的字符都是单个之间有间隔的，所以不存在切割出来的有两个以上连着的字符，然后再通过之前的方法扫描像素点，对单个字符图片切除上下多余的背景。4.按照权利要求1所述的一种基于深度学习的计算机视觉0-O识别方法，其特征在于：所述步骤一中，对制作好的数据集，采用队列方式进行数据读取，读取线程源源不断地将文件系统中的图片读入到一个内存的队列中，而负责计算的是另一个线程，计算需要数据时，直接从内存队列中取，从而解决了GP...

【专利技术属性】
技术研发人员：刘华珠，林盛鑫，陈雪芳，赵晓芳，
申请(专利权)人：东莞理工学院，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人