The invention discloses a method for image classification based on D_MobileNet (Dilated_Mobilenet) neural network. By combining void convolution with MobileNet, the quality of output features can be improved by improving the convolution core receptive field of high resolution input layer without increasing the number of network parameters, so that the classification accuracy of the network structure can be improved. It includes the following steps: 1) preparing data sets; 2) building a MobileNet network; 3) building a D MobileNet network; 4) setting up hyperparameters. After the model is trained, the trained convolution neural network model is used to validate the validation set pictures and complete the classification prediction. The experimental results show that the proposed method can achieve better classification accuracy than the MobileNet network.
【技术实现步骤摘要】
基于D-MobileNet神经网络图像分类方法
本专利技术设计涉及图像分类领域。本专利技术是基于D-MobileNet(Dilated-Mobilenet)神经网络的图像分类方法,由于深度神经网络其自身是一种内存密集性和高计算密集型的模型,MobileNet这种轻量级的深度卷积网络,通过改变卷积计算方式,可减少网络的参数数量和计算量,但是精度会有些损失,本专利技术通过加入空洞卷积,来提高MobileNet的分类精度。
技术介绍
图像分类是深度学习最早的应用领域,且已在图像分类领域取得了很好的成绩。从AlexNet到VGG,GoogleNet,ResNet等均在视觉领域竞赛上取得很好的成绩。随着神经网络的分类精度越来越高,神经网络的结构也更深、更复杂。随之而来的是数百万甚至数十亿的参数和大量的内存,且其大量的计算量需依赖GPU来实现。故提出了压缩神经网络的方法,即在尽量损失较少分类精度的前提下,减少参数数量和计算量。而MobileNet神经网络是众多压缩方法中的一种,即通过改变网络结构实现参数和计算量的减少。MobileNet通过使用深度可分离的卷积来构建轻量级的深度神经网络。其基本结构为深度可分离卷积核(depthwiseseparablefiltes),该卷积核由深度卷积核(depthwiseconvolutionfilters)和点卷积核(pointconvolutionfilter)组成。该网络通过这种结构,将本来一个参数为a*a*c的标准卷积核变为a*a+c个参数(标准卷积核大小为a*a,深度为c)。本专利通过在现有的MobileNet神经网络结构 ...
【技术保护点】
1.基于D‑MobileNet(Dilated‑Mobilenet)神经网络图像分类方法,其特征在于,所述方法包括如下步骤:1)准备数据集;2)MobileNet神经网络的构建;3)D‑MobileNet神经网络的构建;4)超参数设置;准备数据集:本实验在Caltech_256数据集上进行实验,将图片转换为tfrecord的形式进行存储,并在训练和测试时对图片进行预处理,可扩大数据集图片的数量,防止过拟合;MobileNet神经网络的构建:MobileNet神经网络是以深度可分离卷积核为基本结构的28层网络的深度卷积神经网络,一个深度可分离核由深度卷积核和点卷积核组成;MobileNet神经网络包括、1层卷积层、13层深度可分离层、一个全局平均池化层和一层全连接输出层,且该网络无池化层;D‑MobileNet神经网络的构建:选定卷积层的层数,将该层数的卷积核由空洞卷积核替代(前面一两层的高分辨率输入特征的卷积层),通过提高该卷积核的感受野来提高所学习到的特征的质量,进一步提高分类准确度;优化网络超参数:对不同的mini_batch、learning_rate、momentum、训练步长 ...
【技术特征摘要】
1.基于D-MobileNet(Dilated-Mobilenet)神经网络图像分类方法,其特征在于,所述方法包括如下步骤:1)准备数据集;2)MobileNet神经网络的构建;3)D-MobileNet神经网络的构建;4)超参数设置;准备数据集:本实验在Caltech_256数据集上进行实验,将图片转换为tfrecord的形式进行存储,并在训练和测试时对图片进行预处理,可扩大数据集图片的数量,防止过拟合;MobileNet神经网络的构建:MobileNet神经网络是以深度可分离卷积核为基本结构的28层网络的深度卷积神经网络,一个深度可分离核由深度卷积核和点卷积核组成;MobileNet神经网络包括、1层卷积层、13层深度可分离层、一个全局平均池化层和一层全连接输出层,且该网络无池化层;D-MobileNet神经网络的构建:选定卷积层的层数,将该层数的卷积核由空洞卷积核替代(前面一两层的高分辨率输入特征的卷积层),通过提高该卷积核的感受野来提高所学习到的特征的质量,进一步提高分类准确度;优化网络超参数:对不同的mini_batch、learning_rate、momentum、训练步长等超参数进行优化。2.基于D-MobileNet(Dilated-Mobilenet)神经网络图像分类方法,其特征在于,在准备数据集时,将图像从tfrecord中读取出来,并进行随机的左右翻转,随机裁剪成指定尺寸的图片大小,使得在神经网络训练完数据集的一个回合后,重新训练数据集时,可以使得重新训练的输入图片与前一次的训练图片有差异,可扩大数据集图片的数量,避免网络容易造成过拟合的问题。3.基于D-MobileNet(Dilated-Mobilenet)神经网络图像分类方法,其特征在于,搭建MobileNet神经网络时,对Conv1卷积层设计方法如下:对输入的原始图片进行边缘补偿处理,使得防止特征图减小过快,对处理过后的图片进行卷积操作,设置卷积核的大小和滑动步长,卷积处理后得到特征图,再经过一个BatchNormalization即BN处理,再经过ReLU...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。