【技术实现步骤摘要】
基于结构优化稀疏卷积神经网络的图像分类方法及介质
本专利技术属于图像处理
,具体属于模型结构稀疏与图像分类方法
技术介绍
卷积神经网络(CNNs)已经在图像识别领域占有重要的地位,其强大的特征提取能力免去了传统图像识别方法中所必须的繁杂的预处理过程。此外,卷积神经网络还具有权值共享,局部感受野和降采样的特点,相比更早期的多层感知机极大减少了模型的参数,减少了计算的复杂度。在近些年的发展中,各种改进的卷积神经网络也拥有了良好的图像分类准确率。卷积神经网络的发展趋势大致有两种。一是网络的层数越来越多,使得网络的表达能力和对特征的抽象能力越来越强,但随之而来的问题是会存在梯度爆炸和梯度消失的问题,以ResNet中残差模块为代表的方法较好的解决了这一问题。二是卷积层变得越来越宽,拥有更多数量的卷积核意味着能提取更多的特征,但在实际的应用当中,卷积核数量的增多不仅给计算带来了比较大的开销,也出现了许多冗余特征,这些特征对模型的分类效果并不会带来任何贡献。近些年也相继出现了一些模型剪裁的方法,来丢弃掉冗余的连接或 ...
【技术保护点】
1.一种基于结构优化稀疏卷积神经网络的图像分类方法,其特征在于,包括以下步骤:/n步骤1:获取图像的训练集样本,并以图像训练集样本作为输入,预训练一个卷积神经网络,以最小化预测值与真实标签之间的损失函数为优化目标,并保存卷积神经网络的预训练权重;/n步骤2:根据预训练模型中的卷积层通道连接结构进行二进制编码,随机生成若干个二进制序列作为初始种群,对应若干个随机的通道连接结构;/n步骤3:对当前种群中每个编码序列对应的一种通道连接结构应用到预训练模型中,并分别计算每种连接结构的适应度,可重复的选择若干个二进制编码序列,适应度越大的编码序列,被选择的概率越大;/n步骤4:对步骤 ...
【技术特征摘要】
1.一种基于结构优化稀疏卷积神经网络的图像分类方法,其特征在于,包括以下步骤:
步骤1:获取图像的训练集样本,并以图像训练集样本作为输入,预训练一个卷积神经网络,以最小化预测值与真实标签之间的损失函数为优化目标,并保存卷积神经网络的预训练权重;
步骤2:根据预训练模型中的卷积层通道连接结构进行二进制编码,随机生成若干个二进制序列作为初始种群,对应若干个随机的通道连接结构;
步骤3:对当前种群中每个编码序列对应的一种通道连接结构应用到预训练模型中,并分别计算每种连接结构的适应度,可重复的选择若干个二进制编码序列,适应度越大的编码序列,被选择的概率越大;
步骤4:对步骤3中选择出来的二进制编码序列进行交叉和变异的操作,获得新一代种群,交叉概率和变异概率为可调节参数;
步骤5:重复步骤3-4,直至当前迭代次数等于总迭代次数,则迭代结束;
步骤6:选取最后一代种群中适应度最大的编码序列,将其解码为对应的通道连接结构,使用此通道连接结构,并加载预训练模型的权重作为初始权重,进行权重微调,恢复模型的分类准确率;接着将测试集输入到权重微调后的模型中,对测试集图像进行分类。
2.根据权利要求1所述的基于结构优化稀疏卷积神经网络的图像分类方法,其特征在于,所述步骤1:以最小化预测值与真实标签之间的损失函数为优化目标,以训练集样本作为输入,预训练一个卷积神经网络,并保存模型预训练权重,具体为:搭建一个卷积神经网络,使用待学习的图像训练集进行训练,直至模型收敛,以最小化损失函数为目标,使用Adam适应性矩估计优化算法来更新模型的权重,Adam算法具体为:
(1)初始化网络参数θ、一阶矩变量s=0和二阶矩变量r=0、初始时间步t=0;
(2)从训练集中取出包含m个样本的小批量{x(1),...,x(m)},每个样本对应的标签值为{y(1),...,y(m)};
(3)计算梯度t←t+1,L、f分别表示损失函数和模型从输入到输出的映射;
(4)更新有偏一阶矩估计和有偏二阶矩估计,ρ1和ρ2为指数衰减速率,其值在[0,1)区间:
s←ρ1s+(1-ρ1)g;
r←ρ2r+(1-ρ2)g⊙g;
s、r分别表示有偏一阶矩估计和有偏二阶矩估计;
(5)修正一阶矩和二阶矩的偏差:
分别表示修正偏差之后一阶矩估计和二阶矩估计;
(6)计算更新:其中ε表示学习率,σ为用于数值稳定的小常数,通常为10-8;
(7)应用更新:θ←θ+Δθ;
(8)重复(2)-(7)直到t到...
【专利技术属性】
技术研发人员:唐贤伦,徐瑾,李洁,代宇艳,陈瑛洁,余新弦,孔德松,
申请(专利权)人:重庆邮电大学,
类型:发明
国别省市:重庆;50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。