基于全卷积神经网络的高速维码定位识别系统技术方案

技术编号:23625056 阅读:39 留言:0更新日期:2020-03-31 22:47
基于全卷积神经网络的高速维码定位识别系统。本发明专利技术公开一种基于one‑stage策略全卷积神经网络的高速维码定位识别系统,包括数据准备模块、数据增强模块、学习训练模块、一二维码检测定位识别模块。一二维码检测定位识别模块的特征提取网络设置为6个卷积层和5池化层的组合,每2个卷积层中间设置有1池化层,每个池化层步长为2,充分提取维码的特征信息,得到一二维码特征图,并在输出的特征提取图上回归预测输入的一二维码的位置和类别。根据网络模型的测试效果来自动调整、重构下一个待测试卷积神经网络的识别系统配置,增强实时性。本发明专利技术的定位识别系统,图片中单个或多个一二维码的类别及其位置坐标均可被同时检出,检测识别精度>95%,检测速度<5ms/帧。

High speed code location and recognition system based on full convolutional neural network

【技术实现步骤摘要】
基于全卷积神经网络的高速维码定位识别系统
本专利技术涉及一二维码识别
,特别涉及一种基于one-stage策略全卷积神经网络的高速维码定位识别系统。
技术介绍
在日常生活和工业应用中,一二维码的使用越来越广泛,现有技术的一二维码识别方法通过全图搜索定位一维码的起始位置或者二维码的定位图案。然而对于较大尺寸的图像,如快递单、自然场景或文档等,因为一二维码在整副图像中占比较小,并且因为扫码环境的特殊性,反光、光线暗淡等情况均会影响一二维码的识别准确率和识别速度,遗漏或者检测不到一二维码特征点,进而影响到一二维码的识别速度和结果。
技术实现思路
本专利技术提出一种基于one-stage策略全卷积神经网络的高速维码定位识别系统,旨在将卷积神经网络应用于一二维码识别系统,提高一二维码检测的实时性和准确性。为实现上述目的,本专利技术提出的基于one-stage策略全卷积神经网络的高速维码定位识别系统,应用于一维码和二维码的定位识别,包括:数据准备模块,用于准备训练和校验图片集;数据增强模块,用于对所述训练和校验图片集进行增强处理,扩大其目前的数据集并扩展数据集覆盖的场景;学习训练模块,用于设置神经网络的训练参数和管理神经网络的自动化训练过程;一二维码检测定位识别模块,用于通过多层卷积网络充分提取各种输入的一二维码的特征,输出特征提取图,并在输出的特征提取图上回归预测输入的一二维码的位置和类别。优选地,所述一二维码检测定位识别模块设置一特征提取网络和一位置类别检测网络;所述特征提取网络设置为多个卷积层和池化层的组合,每个卷积层包含多个卷积核滤波器用来提取输入的一二维码的特征并输出特征提取图;所述位置类别检测网络包括一卷积层,所述卷积层包含多个卷积核滤波器来对所述特征提取图的特征进行检测,并得到输入的一二维码的位置和类别。优选地,所述位置类别检测网络采用K-means算法预先对所述训练和校验图片集中的所有一二维码的尺度与宽高比例进行统计分析,得到最合适的n个匹配框,并且,在对所述特征提取图的特征进行检测时,对每一个输出特征都做n个匹配框的预测,从而预测得到输入的一二维码的位置和类别,其中n为自然数。优选地,所述位置类别检测网络采用K-means对所述训练和校验图片集中的所有一二维码的尺度与宽高比例进行统计分析,得到占比最高的10个匹配框。优选地,所述特征提取网络设置为6个卷积层和5池化层的组合,每2个卷积层中间设置有1池化层,并且,每个池化层步长为2。优选地,所述特征提取网络和位置类别检测网络的结构设置为以下表格:序号类型滤波器尺寸输入输出激活函数1卷积层163x3/1288×288×1288×288×16ReLU2池化层2x2/2288×288×16144×144×16ReLU3卷积层323x3/1144×144×16144×144×32ReLU4池化层2x2/2144×144×3272×72×32ReLU5卷积层323x3/172×72×3272×72×32ReLU6池化层2x2/272×72×3236×36×32ReLU7卷积层643x3/136×36×3236×36×64ReLU8池化层2x2/236×36×6418×18×64ReLU9卷积层1283x3/118×18×6418×18×128ReLU10池化层2x2/218×18×1289×9×128ReLU11卷积层2563x3/19×9×1289×9×256ReLU12卷积层351x1/19×9×2569×9×35Liner优选地,所述特征提取网络和位置类别检测网络的结构设置为以下表格:序号类型滤波器尺寸输入输出激活函数1卷积层163x3/1352×352×1352×352×16ReLU2池化层2x2/2352×352×16176×176×16ReLU3卷积层323x3/1176×176×16176×176×32ReLU4池化层2x2/2176×176×3288×88×32ReLU5卷积层323x3/188×88×3288×88×32ReLU6池化层2x2/288×88×3244×44×32ReLU7卷积层643x3/144×44×3244×44×64ReLU8池化层2x2/244×44×6422×22×64ReLU9卷积层1283x3/122×22×6422×22×128ReLU10池化层2x2/222×22×12811×11×128ReLU11卷积层2563x3/111×11×12811×11×256ReLU12卷积层351x1/111×11×25611×11×35Liner优选地,所述训练和校验图片集经过所述数据增强模块进行增强处理后,所述学习训练模块对其数据集顺序随机打乱,然后按8:2分为训练数据集和测试数据集。优选地,所述学习训练模块采用小批量梯度下降法训练神经网络。优选地,所述学习训练模块在采用小批量梯度下降法训练神经网络时,设置训练参数的批量值为64,动量配置为0.9,权值设置为0.0本文档来自技高网...

【技术保护点】
1.一种基于one-stage策略全卷积神经网络的高速维码定位识别系统,应用于一维码和二维码的定位识别,其特征在于,包括:/n数据准备模块,用于准备训练和校验图片集;/n数据增强模块,用于对所述训练和校验图片集进行增强处理,扩大其目前的数据集并扩展数据集覆盖的场景;/n学习训练模块,用于设置神经网络的训练参数和管理神经网络的自动化训练过程;/n一二维码检测定位识别模块,用于通过多层卷积网络充分提取各种输入的一二维码的特征,输出特征提取图,并在输出的特征提取图上回归预测输入的一二维码的位置和类别。/n

【技术特征摘要】
1.一种基于one-stage策略全卷积神经网络的高速维码定位识别系统,应用于一维码和二维码的定位识别,其特征在于,包括:
数据准备模块,用于准备训练和校验图片集;
数据增强模块,用于对所述训练和校验图片集进行增强处理,扩大其目前的数据集并扩展数据集覆盖的场景;
学习训练模块,用于设置神经网络的训练参数和管理神经网络的自动化训练过程;
一二维码检测定位识别模块,用于通过多层卷积网络充分提取各种输入的一二维码的特征,输出特征提取图,并在输出的特征提取图上回归预测输入的一二维码的位置和类别。


2.如权利要求1所述的高速维码定位识别系统,其特征在于,所述一二维码检测定位识别模块设置一特征提取网络和一位置类别检测网络;所述特征提取网络设置为多个卷积层和池化层的组合,每个卷积层包含多个卷积核滤波器用来提取输入的一二维码的特征并输出特征提取图;所述位置类别检测网络包括一卷积层,所述卷积层包含多个卷积核滤波器来对所述特征提取图的特征进行检测,并得到输入的一二维码的位置和类别。


3.如权利要求2所述的高速维码定位识别系统,其特征在于,所述位置类别检测网络采用K-means算法预先对所述训练和校验图片集中的所有一二维码的尺度与宽高比例进行统计分析,得到最合适的n个匹配框,并且,在对所述特征提取图的特征进行检测时,对每一个输出特征都做n个匹配框的预测,从而预测得到输入的一二维码的位置和类别,其中n为自然数。


4.如权利要求3所述的高速维码定位识别系统,其特征在于,所述位置类别检测网络采用K-means对所述训练和校验图片集中的所有一二维码的尺度与宽高比例进行统计分析,得到占比最高的10个匹配框。


5.如权利要求3所述的高速维码定位识别系统,其特征在于,所述特征提取网络设置为6个卷积层和5池化层的组合,每2个卷积层中间设置有1池化层,并且,每个池化层步长为2。


6.如权利要求5所述的高速维码定位识别系统,其特征在于,所述特征提取网络和位置类别检测网络的结构设置为以下表格:













序号
类型
滤波器
尺寸
输入
输出
激活函数


1
卷积层
16
3x3/1
288×288×1
288×288×16
ReLU


2
池化层

2x2/2
288×288×16
144×144×16...

【专利技术属性】
技术研发人员:常一志李杰梁步亮
申请(专利权)人:深圳牛图科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1