一种基于深度卷积神经网络和模型压缩的十大功劳检测方法技术

技术编号:27535371 阅读:18 留言:0更新日期:2021-03-03 11:20
本发明专利技术提出一种基于深度卷积神经网络和模型压缩的十大功劳检测方法。上述方法包括,十大功劳图像数据采集、十大功劳预处理模型的搭建与训练、十大功劳识别模型搭建与预训练、模型的微调、模型压缩、十大功劳图像获取、提取十大功劳前景图像,该方法可支持无人设备实现在相关区域进行快速准确的对35类十大功劳进行识别,可以减少相关工作者的工作量,降低事故发生的概率。故发生的概率。故发生的概率。

【技术实现步骤摘要】
一种基于深度卷积神经网络和模型压缩的十大功劳检测方法


[0001]本专利技术属于森林环境环境中十大功劳的检测
,具体涉及到深度学习方法,利用深度卷积神经网络和模型压缩的建模方式,实现对十大功劳的高精度识别与检测目的。

技术介绍

[0002]文献十大功劳(十大功劳属),其主要分布于我国四川、云南、贵州及西藏等区域,大多生于山谷和森林的阴湿处,其花性凉,味甘。根、茎性寒,味苦。含小檗碱、药根碱、木兰花碱等。有清热解毒、止咳化痰之功效,其树,根,茎,叶均可入药。其次,十大功劳的叶形奇特,花朵鲜艳,在江南一带广泛作为园林植物。由于其含有较高的观赏价值和药用价值,许多相关人员都进行实地的检查与摘取。但其主要分布的地势陡峭,不便于相关人员进行现场检测,而通过深度学习方法,建立高精度的识别模型通过图像数据进行处理和分析,通过无人设备搭载的摄像机实现对十大功劳的快速识别,不仅能够高效率的检测并定位十大功劳的具体分布区域,还能够减少有关人员的现场勘测,降低事故发生的概率。

技术实现思路

[0003]本专利技术提出了一种基于深度卷积神经网络的十大功劳检测方法。
[0004]由于人工进行实地检测十大功劳具有一定危险性以及耗费时间精力等问题,本设计利用深度学习的方法,充分考虑深度卷积神经网络的特点,利用卷积层与最大池化层交叠组合方式对输入十大功劳图像进行主要特征提取,进一步组合形成高维抽象特征,通过设置损失函数以及优化算法后对模型进行迭代训练。将训练后的检测模型进行模型压缩优化,剔除冗余参数。在设计识别模型的基础上,增添可选择输入的预处理模型,根据十大功劳的叶片颜色与形状特点,通过获得十大功劳图像,经过灰度值处理、阈值分割和腐蚀膨胀,通过掩膜运算得到十大功劳的前景图像。通过颜色、纹理、形状特征提取后进行训练,使得模型能够是否是对十大功劳具有判别性。最后将压缩后的模型部署到嵌入式系统端以实现模型的离线检测功能。
[0005]实现本专利技术的技术方案是:一种基于深度卷积神经网络和模型压缩的十大功劳检测方法,其特征与所述方法包括图像数据集的采集与数据集制作、预处理模型的建立(其中包括前景图像的获取以及颜色纹理等特征的提取)、识别模型的搭建预训练、模型的压缩与部署等,具体步骤如下所示:
[0006]为实现该技术方案,方法具体包括:
[0007]S1,图像数据获取与训练数据的生成:利用工业CCD相机,采集相关区域十大功劳RGB图像信息,以及在谷歌图库中利用爬虫获取十大功劳共35个种类的图像。根据深度学习算法所需,将上述图片集统一格式,同时转换为28*28像素大小的图片,并且按一定比例制作训练集与验证集,并对训练数据进行标注。
[0008]S2,十大功劳识别模型的搭建与预训练:通过设计逐层递减的卷积层和池化层,来
构建主体识别模型,并且通过大数据集ImageNet输入模型,对目标物进行特征提取和下采样,完成模型的预训练。
[0009]其中S2所述识别模型建模过程步骤如下:
[0010](1)第一步,选用卷积核进行原图像特征提取,输出特征图组;
[0011](2)第二步,通过下采样保留特征图组关键特征,继续输出特征图;
[0012](3)第三步,通过周期性重复,完成高维抽象特征的提取;
[0013](4)第四步,将高维特征N*N排列为1*(N*N),并输入全连接神经网络学习,通过分类器输出结果;
[0014](5)第五步,通过Adam优化算法进行参数的自监督学习。
[0015]S3,模型的微调:利用S1所制作的数据集输入预训练的模型,使得S2模型对于十大功劳的识别具有针对性。S3所述微调方法在于将分类层中十大功劳的softmax层替换预训练模型分类层中的softmax层。
[0016]S4,图像预处理以及预处理模型的设计:针对目标物十大功劳,剔除其周围环境因素影响,设计输入层预处理模型,根据十大功劳的叶片颜色与形状特点,通过获得十大功劳图像,经过灰度值处理、阈值分割和腐蚀膨胀,通过掩膜运算得到十大功劳的前景图像。提取前景图像步骤如下:
[0017](1)第一步,以十大功劳RGB图像为输入,将三通道的像素值进行1.1G-[0018]R的操作,得到灰度图像;上述灰度图像处理流程为:
[0019][0020]其中G为RGB图像的G通道,R为RGB图像的R通道,CF(x,y)为(x,y)处的灰度值;
[0021](2)第二步,将得到的灰度图像进行阈值分割得到二值图像,阈值分割的流程为:
[0022](i)统计灰度级中每个像素在一张图片中的个数,根据所设置阈值,统计灰度值小于阈值的像素个数N0,大于阈值的像素个数N1,以及对应的占比W0和W1:
[0023]W0=N0/M*N
[0024]W1=N1/M*N
[0025]W0+W1=1
[0026]μ=W0*μ0+W1*μ1
[0027]图像大小为M*N,μ为图像总平均灰度,μ0和μ1分别代表低于和高于阈值点的图像像素平均灰度值;
[0028](ii)对灰度级进行遍历搜索,计算当前灰度值下前景和背景的类间概率g:g=W0(μ0-μ)^2+W1(μ1-μ)^2
[0029](iii)通过上述目标函数,解出当g最大时的阈值;
[0030](3)第三步,将二值图像进行修补和去噪,得到完善的二值图;
[0031]修补通过膨胀和腐蚀形态学操作,如下所示:
[0032]膨胀的数学表达式:
[0033]腐蚀的数学表达式:
[0034](4)第四步,将RGB图像与二值图像进行掩膜运算,得到前景图像;提取前景图像之后,然后对于图像进行颜色,纹理,形状特征的提取,将其作为筛选特征,用于训练预处理模型。预处理模型的训练步骤如下所示:
[0035](1)第一步,将图片按上述方式提取前景图像;
[0036](2)第二步,将前景图像分别提取其颜色,纹理,形状特征;
[0037]颜色特征为:
[0038][0039][0040]式中M
i1
,M
i2
,M
i3
是颜色的一阶矩,二阶矩和三阶矩,N表示图像像素个数,P
ij
表示RGB图像中第i个通道分量中灰度j的像素出现的概率;
[0041]形状特征包括圆形度、细长比、凹凸度、固靠度:
[0042]圆形度的计算公式为:式中area为目标的面积,即目标的总像素数;Perimeter为目标的周长,即目标最外侧轮廓长度;
[0043]细长比的计算公式为:式中thiclicness为目标最小外接矩的宽度;
[0044]凹凸度的计算公式为:式中convex_perimeter为目标最小凸多边形的周长;
[0045]固靠度的计算公式为式中convex_area为目标最小凸多边形的面积;
[0046]纹理特征包括:
[0047]首先对GLMC本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度卷积神经网络和模型压缩的十大功劳检测方法,其特征与所述方法包括:S1、图像数据获取与训练数据的生成:利用工业CCD相机,采集相关区域十大功劳RGB图像信息,以及在谷歌图库中利用爬虫获取十大功劳共35个种类的图像;根据深度学习算法所需,将上述图片集统一格式,同时转换为28*28像素大小的图片,并且按一定比例制作训练集与验证集,并对训练数据进行标注;S2、十大功劳识别模型的搭建与预训练:通过设计逐层递减的卷积层和池化层,来构建主体识别模型,并且通过大数据集ImageNet输入模型,对目标物进行特征提取和下采样,完成模型的预训练;步骤S2包括以下步骤:S2.1:选用卷积核进行原图像特征提取,输出特征图组;S2.2:通过下采样保留特征图组关键特征,继续输出特征图;S2.3:通过周期性重复,完成高维抽象特征的提取;S2.4:将高维特征N*N排列为1*N*N,并输入全连接神经网络学习,通过分类器输出结果;S2.5:通过Adam优化算法进行参数的自监督学习;S3、模型的微调:利用S1所制作的数据集输入预训练的模型,使得S2模型对于十大功劳的识别具有针对性;S3所述微调方法在于将分类层中十大功劳的softmax层替换预训练模型分类层中的softmax层;S4、图像预处理以及预处理模型的设计:针对目标物十大功劳,剔除其周围环境因素影响,设计输入层预处理模型,通过处理获得十大功劳前景图像,步骤S4包括以下步骤:S4.1:以十大功劳RGB图像为输入,将三通道的像素值进行1.1G-R的操作,得到灰度图像;上述灰度图像处理流程为:其中G为RGB图像的G通道,R为RGB图像的R通道,CF(x,y)为(x,y)处的灰度值;S4.2:将得到的灰度图像进行阈值分割得到二值图像,阈值分割的步骤为:(i)统计灰度级中每个像素在一张图片中的个数,根据所设置阈值,统计灰度值小于阈值的像素个数N0,大于阈值的像素个数N1,以及对应的占比W0和W1:W0=N0/M*NW1=N1/M*NW0+W1=1μ=W0*μ0+W1*μ1其中图像大小为M*N,μ为图像总平均灰度,μ0和μ1分别代表低于和高于阈值点的图像像素平均灰度值;(ii)对灰度级进行遍历搜索,计算当前灰度值下前景和背景的类间概率g:g=W0(μ0-μ)^2+W1(μ1-μ)^2
(iii)通过上述目标函数,解出当g最大时的阈值;S4.3:将二值图像进行修补和去噪,得到完善的二值图;修补通过膨胀和腐蚀形态学操作,如下所示:膨胀的数学表达式:腐蚀的数学表达式:S4.4:将RGB图像与二值图像进行掩膜运算,得到前景图像;提取前景图像之后,然后对于图像进行颜...

【专利技术属性】
技术研发人员:鲍佳松黄细霞卢占标姬克
申请(专利权)人:上海海事大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1