当前位置: 首页 > 专利查询>淮阴工学院专利>正文

一种轻量化蘑菇识别方法及装置制造方法及图纸

技术编号:36813138 阅读:22 留言:0更新日期:2023-03-09 00:57
本发明专利技术公开了一种轻量化蘑菇识别方法及装置,方法包括:S1、摄像头采集实时视频,并将视频流解码成图像数据集;S2、对图像数据集和图像进行预处理;S3、设计轻量化卷积神经网络,快速提取出蘑菇的视觉特征并预测标签;S4、计算标签预测值与标签真实值的误差,通过自动调整梯度修改网络参数,得到蘑菇识别模型;S5、预处理后的训练数据集批量输入蘑菇识别模型中进行训练;S6、训练后蘑菇识别模型代码部署在总控上。本发明专利技术优点在于,轻量级卷积神经网络利用残差结构、通道分流和深度卷积结合方式,来解决卷积神经网络因多层重复叠加的深度结构而导致的计算量、参数增大问题。参数增大问题。

【技术实现步骤摘要】
一种轻量化蘑菇识别方法及装置


[0001]本专利技术涉及计算机视觉处理的图像识别
,具体是涉及一种轻量级蘑菇识别方法及装置。

技术介绍

[0002]深度学习作为计算机视觉研究中的热门方向,现有的采摘机器人中蘑菇识别任务主流技术是通过深度学习中的Xception、ResNet等深度神经网络完成蘑菇特征提取和识别。这类神经网络需要通过多层重复叠加的方式,来提升蘑菇的视觉特征提取效果,进而优化蘑菇识别算法的性能。但是,深度神经网络的结构加深会出现程序运行中计算量和参数存储量急剧加深的问题,同时蘑菇识别装置要满足配置高性能GPU处理器的硬件要求,这样会提高采摘机器人成本。
[0003]为解决上述问题,本专利技术的目的在于,面对蘑菇采摘机器人,提供一种轻量级蘑菇识别方法及装置,缓解了深度神经网络结构加深导致的计算量、存储量增大的问题,满足了工业上蘑菇识别的硬件需求。

技术实现思路

[0004]本专利技术的第一个目的是提供了一种轻量化蘑菇识别方法,利用通道分流和深度卷积结合方式,缓解了卷积神经网络因深度结构增加而导致的计算量增大问题。
[0005]本专利技术的第二个目的是提供了一种轻量化蘑菇识别装置。
[0006]本专利技术公开了一种轻量化蘑菇识别方法,所述轻量化蘑菇识别方法包括如下步骤:
[0007]步骤1:使用摄像头采集实时视频,并将视频流解码得到的多张图像帧作为图像数据集;
[0008]步骤2:对步骤1中采集到的图像作作去噪预处理,
[0009]把图像局部区域的像素按照亮度值大小排序,取其中值作为中心点的亮度值,具体包括以下步骤:
[0010]设置方形滤波器边长为k,在图像的上下边界各填充行0值,在图像的左右边界各填充列0值;
[0011]方形滤波器中值全设置为1,将方形滤波器与图像对应的局部区域像素值相乘,把相乘后的像素值排序,取中值作为图像局部区域中心点的像素值。
[0012]步骤3:设计轻量化卷积神经网络,快速地提取出图像中蘑菇的视觉特征,并得到图像标签预测值,具体包括以下内容:
[0013]轻量级卷积神经网络的输入图像大小为224
×
224,第一层是对输入图像每个3
×
3的局部区域进行卷积,得到大小为112
×
112的特征图。第二层是对第一层输出的特征图每
个3
×
3的局部区域进行最大值池化,得到大小为56
×
56的特征图。第三层是将第二层输出的特征图输入到残差卷积模块stage2中,得到大小为28
×
28的特征图。第四层是将第三层输出的特征图输入到残差卷积模块 stage3中,得到大小为14
×
14的特征图。第五层是将第四层输出的特征图输入到残差卷积模块stage4中,得到大小为7
×
7的特征图。第六层是对第五层输出的特征图进行卷积,得到大小为7
×
7的特征图。第七层是对第六层输出的特征图进行全局池化,得到1
×
1的特征图。第八层将第七层输出的特征图输出到全连接层,全连接层输出经过sigmod函数预测分类类型,输出预测标签。
[0014]其中,第三层的残差卷积模块stage2是对输入特征图依次进行一次Unit2 和三次Unit1操作,再将操作后得到的特征图与原特征图进行通道拼接实现特征图升维,将拼接后的通道顺序打乱实现特征信息融合。第四层的残差卷积模块 stage3是对输入特征图依次进行一次Unit2和七次Unit1操作,再将操作后得到的特征图与原特征图进行通道拼接实现特征图升维,将拼接后的通道顺序打乱实现特征信息融合。第五层的残差卷积模块stage4是对输入特征图依次进行一次Unit2和三次Unit1操作,再将操作后得到的特征图与原特征图进行通道拼接实现特征图升维,将拼接后的通道顺序打乱实现特征信息融合,最后输出通道打乱后的特征图。
[0015]其中,Unit1操作是对输入特征图的通道数分为两部分,一半通道数的特征图依次进行1
×
1卷积、5
×
5深度分离卷积、1
×
1卷积,然后将卷积后的特征图与另一半通道数的特征图进行通道拼接,将拼接后的特征图通道顺序打乱,最后通道打乱后的特征图。Unit2操作是对输入特征图的通道数分为两部分,一半通道数的特征图依次进行1
×
1卷积、5
×
5深度分离卷积、1
×
1卷积,另一半通道数的特征图依次进行5
×
5深度分离卷积、1
×
1卷积,然后将两部分操作后的特征图通道进行拼接,将拼接后的特征图通道顺序打乱,最后通道打乱后的特征图。
[0016]步骤4:计算步骤3中得到的标签预测值与图像标签真实值的误差,通过误差变化自动调整网络参数,得到蘑菇识别模型。
[0017]步骤5:将步骤2中预处理后的训练数据集批量输入到步骤4中的蘑菇模型中,同时使用步骤2中预处理后的验证数据集进行验证,当验证结果的准确率达到精度要求时,就结束训练任务。
[0018]步骤6:将训练任务后的蘑菇识别模型代码部署在总控上。
[0019]一种轻量级蘑菇识别装置,包括摄像头1、排线2、电源3、TPYE

C接口的数据线4、主控5、micro HDMI视频线6、显示屏7、读卡器8、存储卡9。主控 5使用的是树莓派4b;摄像头1使用的是IMX477R高清摄像头,通过排线2与主控5连接;电源3通过TPYE

C接口的数据线4与主控5的USB TYPE

C接口连接;显示屏7通过micro HDMI视频线与主控5的HDMI1接口连接;存储卡9使用的是64g的microSD卡,通过读卡器8与主控连接。
[0020]当电源3通电时候,摄像头1进行采集实时视频流数据,将采集到视频流数据通过主控5控制储存到存储卡9上,主控5通过读取存储卡9中的视频流数据进行预处理和蘑菇识别,将识别结果输给显示屏7。
[0021]本专利技术中的优化模块,一方面通过通道分流和深度卷积计算减少标准卷积的参数量,另一方面通过残差结构,实现多层重复叠加的特征提取效果,并缓解了深度映射带来的计算成本。
附图说明
[0022]图1为本专利技术轻量化蘑菇识别方法的流程图;
[0023]图2为本专利技术装置的结构示意图。
[0024]图3为本专利技术轻量化卷积神经网络的参数配置表。
[0025]图4为本专利技术中Stage2、Stage3、Stage4中Unit2操作和Unit1操作的分配示意图;
[0026]图5是本专利技术中Unit2操作和Unit1操作示意图。
具体实施方式
[0027]下面结合附图和具体实施例对本专利技术进行详细说明。下述实施方式只为说明本专利技术的技术构思及特点,其目的在于让熟悉此项技术的人能够了解本专利技术的内容并据以实施本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种轻量级蘑菇识别方法,其特征在于,包括如下步骤:步骤1:使用摄像头采集实时视频,并将视频流解码得到的多张图像帧作为图像数据集;步骤2:对步骤1中采集到的图像作去噪预处理;步骤3:设计轻量化卷积神经网络,快速地提取出图像中蘑菇的视觉特征,并得到图像标签预测值;步骤4:计算步骤3中得到的标签预测值与图像标签真实值的误差,通过误差变化自动调整网络参数,得到蘑菇识别模型;步骤5:将步骤2中预处理后的训练数据集批量输入到步骤4中的蘑菇模型中,同时使用步骤2中预处理后的验证数据集进行验证,当验证结果的准确率达到精度要求时,就结束训练任务;步骤6:将训练任务后的蘑菇识别模型代码部署在总控上。2.根据权利要求1所述的一种轻量级蘑菇识别方法,其特征在于,所述步骤3中轻量化卷积神经网络,具体为:1)蘑菇图像数据输入值尺寸为224
×
224,通过第一层卷积对输入蘑菇图像3
×
3区域进行初次提取特征,得到尺寸为112
×
112的特征图;2)112
×
112的特征图通过第二层的最大池化操作,得到尺寸为56
×
56的蘑菇特征图;3)第三层将第二层输出的特征图输入到残差卷积模块stage2中,得到大小为28
×
28的特征图;4)第四层将第三层输出的特征图输入到残差卷积模块stage3中,得到大小为14
×
14的特征图;5)第五层将第四层输出的特征图输入到残差卷积模块stage4中,得到大小为7
×
7的特征图;6)第六层对第五层输出的特征图进行卷积,得到大小为7
×
7的特征图;7)第七层对第六层输出的特征图进行全局池化,得到1
×
1的特征图;8)第八层将第七层输出的特征图输出到全连接层,全连接层输出经过sigmod函数预测分类类型,输出预测标签。3.根据权利要求1所述的一...

【专利技术属性】
技术研发人员:胡荣林王媛媛蔡进恒刘宬邑朱诗雯卢琛魏福董甜甜张海燕邵鹤帅严立兵
申请(专利权)人:淮阴工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1