The present invention proposes an optimization method of dense and sparse dense algorithm, including initial Dense training stage, Fuzzy stage and final Dense stage. The method uses membership degree to measure the degree of association between network weight and the whole network, and to determine the degree of association between each data information and cluster. The invention has the following points: 1. Compared with other classical networks, the optimization network proposed by the invention is based on the value of learning weights, and calculates which network weights are the most important connections, which improves the classification accuracy better. 2. Compared with traditional DSD, the framework mobility of the present invention is improved and can be used in other new networks such as VGG16, Vgg19 and so on after Alexnet. 3. Aiming at the problem of tens of thousands of iterations classification required by traditional deep neural network, the present invention can effectively improve the classification accuracy within hundreds of iterations.
【技术实现步骤摘要】
一种密集稀疏密集算法的优化方法
本专利技术属于图像分类领域,涉及一种密集稀疏密集算法的优化方法。
技术介绍
深度学习属于机器学习领域,随着更多优秀神经网络的提出,我们知道复杂网络的性能更好地证明了特征信息与输出之间的高度非线性相关性。但随着网络的不段的加深,层数越来越多,网络参数也大量增加,这样就导致网络训练的难度不断上升。宋汉提出了一种密集稀疏密集(DSD)算法,重点关注如何通过改进训练过程来提高传统模型的准确性。通过稀疏度来修剪权重小、不重要的网络权重,并基于稀疏约束重新训练网络来标准化网络。虽然DSD和dropout在训练期间都有修剪操作,但不同之处在于DSD根据权重的绝对值选择要删除的连接,随机删除丢弃,而dropout是随机去掉连接。另外DSD也不是模型压缩算法,DSD算法训练模型目的是提高准确率,而不是模型压缩。在在DSD算法优化过程中,鞍点和局部最优很容易影响模型的性能,这些点的梯度接近0,模型接近收敛。通过获得稀疏网络并在训练过程中继续训练,可以跳过这一点,这样密集训练可以收敛到更好的结果。DSD算法通过选择性网络权重来提高网络的性能,但它不能准确区分那些不重要的网络权重。针对这些问题,本专利技术提出了一种模糊DSD算法,该模糊DSD基于现有的密集稀疏密集算法,本专利技术方法关注如何通过改进训练过程提高传统模型的准确率。
技术实现思路
本专利技术主要是对DSD算法的结构优化,DSD算法中设置唯一参数:稀疏度,来衡量网络权重的重要性,即判断网络权重是否需要裁剪。这样虽然通过对网络权重进行有选择性的处理使得网络的性能得到了提高,但是并不能准确的区别 ...
【技术保护点】
1.一种密集稀疏密集算法的优化方法,包括初始Dense训练阶段、Fuzzy阶段、最后Dense阶段,其特征在于,包括如下步骤:步骤1,初始Dense阶段经过训练得到初始网络权值,输入数据对网络原始结构进行训练,得到网络最优参数,再将训练得到的参数作为Fuzzy训练阶段的初始化权值;步骤2,在Fuzzy训练阶段,先计算每一层N个网络权值W的数值总和S,然后求出每个网络权值在S中所占的比例η,即隶属度;
【技术特征摘要】
1.一种密集稀疏密集算法的优化方法,包括初始Dense训练阶段、Fuzzy阶段、最后Dense阶段,其特征在于,包括如下步骤:步骤1,初始Dense阶段经过训练得到初始网络权值,输入数据对网络原始结构进行训练,得到网络最优参数,再将训练得到的参数作为Fuzzy训练阶段的初始化权值;步骤2,在Fuzzy训练阶段,先计算每一层N个网络权值W的数值总和S,然后求出每个网络权值在S中所占的比例η,即隶属度;其中,W表示权值,是指层数,N表示每层网络权值的个数,计算每一层N个网络权值W的数值总和S,求出每个网络权值在S中所占的比例η,即为隶属度,i表示层数,j表示每层权重的个数,这里m是总层数,n是每层权重总个数;初始Dense阶段到Fuzzy阶段用隶属度来判断网络权值的重要性,通过隶属度将网络权值进行分类,对网络中不重要的连接和权值进行裁剪,把网络修剪成中小网络;步骤3,将网络中的权值重新进行迭代训练,迭代公式如下,其中,t为迭代次数,a是表示学习率,x表...
【专利技术属性】
技术研发人员:王改华,刘文洲,罗冷坤,吕朦,袁国亮,李涛,
申请(专利权)人:湖北工业大学,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。