当前位置: 首页 > 专利查询>南通大学专利>正文

一种改进的数字识别方法技术

技术编号:33288272 阅读:15 留言:0更新日期:2022-05-01 00:00
本发明专利技术提供一种改进的数字识别方法,涉及深度学习、机器学习、计算机视觉、图像分类技术领域。其中方法包括以下步骤:S1:制作数字数据集,并进行图像增强;S2:在PP

【技术实现步骤摘要】
一种改进的数字识别方法


[0001]本专利技术涉及深度学习、机器学习、计算机视觉、图像分类
,尤其涉及一种改进的数字识别方法。

技术介绍

[0002]近年来,人工神经网络技术取得了巨大的发展,它所具有的优势:固有的并行结构和并行处理、知识的分布存储、容错性、自适应性、模式识别能力,这为手写体数字识别开辟了新的途径。数字识别作为模式识别的一个分支,在邮政、税务、交通、金融等行业的实践活动中有着及其广泛的应用。
[0003]在现有关于数字识别的研究中,存在需要花费大量时间对不同特征进行验证、模型的结构越来越复杂、对硬件的计算性能越来越高等缺点。
[0004]王建仁等提出的LeNET

DL模型对真实数据的识别准确度达到78.89%,但模型仍需要较高性能的智能边缘设备,识别精准度仍需提升。

技术实现思路

[0005]本专利技术的目的是为了解决现有技术中提出的模型需要较高性能的智能边缘设备,识别精准度需要提高等技术问题。
[0006]为了实现上述目的,本专利技术采用了如下技术方案:
[0007]一种改进的数字识别方法,其特征在于:包含以下步骤:
[0008]S1:制作数字数据集,并进行图像增强;
[0009]S2:在PP

LCNet的基础上引入ShuffleNetV2模块,更换部分激活函数,使用下采样结构进行下采样;
[0010]S3:使用数据增强过的数据集训练改进的PP

LCNet网络;<br/>[0011]S4:完成模型的训练后,将模型部署在移动端。
[0012]进一步的,所述数字数据集通过网络爬虫及现有数据集进行获取,通过网络爬虫获取图片后,对所有图片进行筛选,除去不符合要求的图片;对符合要求的图片进行人工标注,标注类别为数字0~9共10类。
[0013]进一步的,所述S1中的图像增强包括随机水平翻转、随机缩放、随机亮度调整,最终得到图像增强过的数字数据集。
[0014]进一步的,所述S2包含以下步骤:
[0015]S2.1、PP

LCNet的最后两个DepthSepConv替换为ShuffleNetV2网络结构,即对于步长为二的DepthSepConv使用ShuffleNetV2步长为二的模块单元,对于步长为一的DepthSepConv使用ShuffleNetV2步长为一的模块单元,并且为了减少冗余,在ShuffleNetV2步长为一的模块单元加入Ghost模块,此外在两个ShuffleNetV2模块中加入SE模块,增强模型在通道上的注意力;
[0016]S2.2、为减少模型推理速度的同时提高模型精度,将PP

LCNet网络中的第一个
Conv2D以及前五个DepthSepConv的激活函数由Hard

swish替换为Relu;
[0017]S2.3、通过3
×
3以及5
×
5深度可分离卷积进行下采样来使特征图减少为原来一半,然后将两个卷积的输出在通道上进行concat,使通道数增大为原来两倍;然后使用1
×
1卷积,来融合通道上的信息;最后添加SE模块,引入注意力机制。
[0018]进一步的,所述S3包含以下步骤:使用迁移学习训练,在预训练模型基础上进行微调,同时采用指数平均移动(EMA),学习率(lr)采用余弦学习率。训练总轮数(epochs)与学习率的关系如公式所示:
[0019][0020]其中epoch为当前轮数从[0,epochs]增加,begin_rate为初始学习率。
[0021]进一步的,指数移动平均(EMA)通过指数衰减方式计算参数更新过程中的移动平均值,对于每一个参数U,都有一个指数移动平均值Ut,U和Ut关系见如下公式:
[0022]U
t
=β
×
U
t
‑1+(1

β)
×
U(t≥1)
[0023]其中,β为衰减系数,使用Ut进行参数更新,所述β=0.98,Ut初始值为0。
[0024]进一步的,所述S4中移动端为EdgeBoard,使用PaddlePaddle2.1.2作为深度学习框架并使用PaddleLite加速模型在移动端的推理;部署完成后即可通过摄像头输入待检测图片,EdgeBoard对输入待分类的数字图像进行推理,输出预测结果,完成数字识别。
[0025]本申请还提供了一种数字识别系统,使用上述所述的一种改进的数字识别方法构建而成。
[0026]与现有的数字识别技术相比,本专利技术的有益效果:
[0027]1、提出了改进的PP

LCNet,与原有的PP

LCNet模型相比,本申请构建的数字识别系统具有精度高、速度快等优点,能够满足在移动端进行数字识别的实时性要求,并且本方法的参数量更少,在移动端部署更加容易。
[0028]2、与其他轻量级模型相比,本申请构建的数字识别系统的速度更快,更能适应各种复杂的数字书写方式,且实用性与泛化性更高。
附图说明
[0029]图1为本专利技术实施方式中未改进的PP

LCNet网络结构;
[0030]图2为本专利技术实施方式中改进后的ShuffleNetV2网络结构;
[0031]图3为本专利技术实施方式中下采样方法的流程图;
[0032]图4为本专利技术实施方式中基于改进PP

LCNet的数字识别系统的流程图。
具体实施方式
[0033]为使本专利技术的目的、技术方案和优点更加清楚,以下结合具体实施例,对本专利技术作进一步地详细说明。
[0034]在下面的描述中阐述了很多具体细节以便于充分理解本专利技术,但是,本专利技术还可以采用不同于在此描述的其他方式来实施,因此,本专利技术并不限于下面公开说明书的具体实施例的限制。
[0035]PP

LCNet是—种基于MKLDNN加速策略的轻量级CPU网络,它提高了轻量级模型在
多任务上的性能。在图像分类上,PP

LCNet相比目前主流的轻量级网络,PP

LCNet在相同精度下可以获得更快的推理速度。当使用百度自研的SSLD蒸馏策略后,精度进一步提升。
[0036]专利技术公开了一种改进的数字识别方法,具有识别速度快,精度高,计算量少,实用性与广泛性更高等优点,并且在移动端部署更加容易。
[0037]一种改进的数字识别方法,包含以下步骤:
[0038]S1:制作数字数据集,并进行图像增强;
[0039]具体的,在一实施方式中,所述数字数据集通过网络爬虫及现有数据集中获得,其中网络爬虫的图片来源于谷、必应、搜狗、百度等图库,本申请所采用的现有数据集为MNIST数据集中,其中网络爬虫获得4本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种改进的数字识别方法,其特征在于:包含以下步骤:S1:制作数字数据集,并进行图像增强;S2:在PP

LCNet的基础上引入ShuffleNetV2模块,更换部分激活函数,使用下采样结构进行下采样;S3:使用数据增强过的数据集训练改进的PP

LCNet网络;S4:完成模型的训练后,将模型部署在移动端。2.根据权利要求1所述的改进的数字识别方法,其特征在于:所述数字数据集通过网络爬虫及现有数据集进行获取,通过网络爬虫获取图片后,对所有图片进行筛选,除去不符合要求的图片;对符合要求的图片进行人工标注,标注类别为数字0~9共10类。3.根据权利要求1所述的改进的数字识别方法,其特征在于:所述S1中的图像增强包括随机水平翻转、随机缩放、随机亮度调整,最终得到图像增强过的数字数据集。4.根据权利要求1所述的改进的数字识别方法,其特征在于:所述S2包含以下步骤:S2.1、PP

LCNet的最后两个DepthSepConv替换为ShuffleNetV2网络结构,即对于步长为二的DepthSepConv使用ShuffleNetV2步长为二的模块单元,对于步长为一的DepthSepConv使用ShuffleNetV2步长为一的模块单元,并且为了减少冗余,在ShuffleNetV2步长为一的模块单元加入Ghost模块,此外在两个ShuffleNetV2模块中加入SE模块,增强模型在通道上的注意力;S2.2、为减少模型推理速度的同时提高模型精度,将PP

LCNet网络中的第一个Conv2D以及前五个DepthSepConv的激活函数由Hard

swish替换为Relu;S2.3、通过...

【专利技术属性】
技术研发人员:邵叶秦杨启硕赵梦婷胡春红沈玉赵恒宋锦伟周昆阳施佺
申请(专利权)人:南通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1