【技术实现步骤摘要】
一种复杂自然场景下的数字仪表识别方法
本专利技术涉及数字仪表识别
,尤其涉及一种复杂自然场景下的数字仪表识别方法。
技术介绍
数字仪表识别是指利用计算机自动从数字图像中找到数字字符的位置并识别数字字符的技术,属于模式识别的范畴。数字仪表以其精度高、读取方便、易设置等优点在工业和检测领域得到了广泛的应用。目前,数字仪表的识别主要有两种形式:1、基于人工的仪表识别。该方法需要人工肉眼对仪表进行识别并记录,其过程繁琐且效率低下。并且在人工读取的过程中,由于人的主观原因或者外界环境因素易产生读数误差,导致测量精度下降。同时对于一些外部环境比较恶劣的现场,比如化工、电力等含有有害气体或低温、高温、高辐射的场所,都不适合用人工的方式对仪表示值进行读数。2、基于机器视觉的仪表识别。该方法是利用摄像机对仪表图像进行采集,并根据机器视觉的算法对图像进行识别,大大提高了仪表识别的效率。此类方法采用机器视觉代替人工对仪表进行识别,不仅减少人为主观因素造成的误差,而且消除了人工现场操作的危险性。但是现有的基于机器视觉的仪表识别方法,只能针对背景单一的数字仪表进行定位、分割和识别,且 ...
【技术保护点】
1.一种复杂自然场景下的数字仪表识别方法,其特征在于,包括以下步骤:步骤1:利用SSD算法进行复杂自然场景下的数字仪表区域定位;步骤2:利用ResNet50神经网络提取特征,利用双向LSTM网络对提取的特征进行训练,获得数字仪表区域的文本行定位;步骤3:利用ResNet50神经网络提取文本行特征,利用BRNN网络对提取的文本行特征进行训练,利用CTC算法获得数字仪表识别结果。
【技术特征摘要】
1.一种复杂自然场景下的数字仪表识别方法,其特征在于,包括以下步骤:步骤1:利用SSD算法进行复杂自然场景下的数字仪表区域定位;步骤2:利用ResNet50神经网络提取特征,利用双向LSTM网络对提取的特征进行训练,获得数字仪表区域的文本行定位;步骤3:利用ResNet50神经网络提取文本行特征,利用BRNN网络对提取的文本行特征进行训练,利用CTC算法获得数字仪表识别结果。2.根据权利要求1所述的一种复杂自然场景下的数字仪表识别方法,其特征在于,所述步骤1包括:步骤1.1:对样本数据进行预处理,获得预处理后的样本数据;步骤1.2:构建SSD网络模型,在VGG16的基础网络结构上,将第6层和第7层的全连接层转化成卷积层;增加3个卷积层和一个平均池化层;步骤1.3:对卷积后的每张特征图,采用3×3卷积生成默认框的回归后的坐标和类别概率;每个所述默认框的大小的计算公式为:其中m为特征图数目,smin为最底层默认框大小,smax为最顶层默认框大小;步骤1.4:定义事先标注好的指针式仪表区域为groundtruthbox,通过groundtruthbox对SSD网络模型进行训练;利用训练好的SSD网络进行多角度指针式仪表的精确定位;训练过程如下所示:将实际选取的默认框priorbox和groundtruthbox按照IOU进行匹配,IOUT1的priorbox为正样本,其余为负样本,所述T1为0.7;将priorbox的回归损失由高到低进行排序,选择回归损失最高的M个priorbox作为集合D,匹配成功后的正样本作为集合P,则正样本集为P-D∩P,负样本集为D-D∩P;所述正样本集和负样本集中正样本和负样本的数量比为1:4,即M为priorbox数量的1/4;通过损失函数调整网络参数,完成指针式仪表的定位;所述损失函数为:其中,c为类别概率,l为预测框,N为与groundtruthbox相匹配的priorbox个数;如果N=0,损失函数为0;L...
【专利技术属性】
技术研发人员:张晨民,彭天强,李丙涛,
申请(专利权)人:郑州金惠计算机系统工程有限公司,
类型:发明
国别省市:河南,41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。