一种动态深度置信网络分析方法技术

技术编号：18764554 阅读：38 留言：0更新日期：2018-08-25 10:50

本发明专利技术涉及深度学习领域的一种基于深度置信网络的动态网络结构训练分析方法。本发明专利技术的目的在于克服深度置信网络的几点不足，提供一种基于深度置信网络的由整体至特殊的动态网络结构训练分析策略。该策略参考人类识别物体时大脑的分析策略，引入细致化分析的过程。该策略针对分类问题，在训练阶段产生两种网络，包括一个全局网络和若干个针对具体的各个类别的特殊网络。在预测阶段，综合考虑两种网络的输出结果，使得整个模型的预测更加具有针对性，从而提高分类模型的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种动态深度置信网络分析方法
本专利技术涉及深度学习领域的一种基于深度置信网络的动态网络结构训练分析方法。技术背景●深度置信网络深度置信网络(Deepbeliefnetwork,DBN)是深度学习领域的一种概率生成模型，该模型由GeoffreyHinton在他于2006年发表的论文“AFastLearningAlgorithmForDeepBeliefNets”中提出，通常用于分类。与传统的判别模型的神经网络相对，深度置信网络用于建立一个观察数据和标签之间的联合分布。理论上，对于神经网络结构，隐藏层的层数越多，模型的表达力能也就越强。但当网络层数逐渐加深的时候，使用传统的梯度下降算法来优化参数会产生一些问题。比如当计算最前面几层网络层的误差时，梯度值会非常小，如此造成这几层链接的权重修改过小，产生所谓的“梯度消失”问题。深度置信网络通过逐层非监督地训练的方法，先求取比较接近最优解的初始权重，从而成功地避免了这类问题。这使得神经网络可以真正地增加其深度，使其性能大幅地提高。深度置信网络也真正开启了深度学习领域的研究热潮。深度置信网络由一些包含多个节点的网络层组成，这些网络层以一个输入层为起始,若干个隐藏层为中间结构，再以一个输出层为结束。每层的节点与其相邻层的节点均一一相连。可将深度置信网络看成由一堆受限的玻尔兹曼机(RestrictedBoltzmannMachines,RBMs)组成的网络，在这堆受限的玻尔兹曼机中，每个隐藏层都被当做下一个隐藏层的可见层。网络参数的训练分为两个步骤——预训练和微调。在预训练阶段，深度置信网络采用逐层无监督的方法来学习...

【技术保护点】
1.一种基于深度置信网络的动态网络结构训练分析方法，其特征在于，该训练分析策略，包括：一，训练阶段：在训练阶段，需获取一个全局网络和包含一系列特殊网络的网络池；首先，以全部的训练集有监督地训练全局网络；在训练完该全局网络后，针对每个类再基于全局网络来训练一个特殊的针对性网络，该网络去掉对该类的分类结果产生干扰的节点，从而使得这一具体的类的分类性能更加强大；这一系列特殊网络的训练基于Fisher判别函数；在训练第i类的特殊网络时，先将整个训练集重新划分为两类，即除了第i类的实例，其它实例都合并为一类，称之为非i类(记为

【技术特征摘要】
1.一种基于深度置信网络的动态网络结构训练分析方法，其特征在于，该训练分析策略，包括：一，训练阶段：在训练阶段，需获取一个全局网络和包含一系列特殊网络的网络池；首先，以全部的训练集有监督地训练全局网络；在训练完该全局网络后，针对每个类再基于全局网络来训练一个特殊的针对性网络，该网络去掉对该类的分类结果产生干扰的节点，从而使得这一具体的类的分类性能更加强大；这一系列特殊网络的训练基于Fisher判别函数；在训练第i类的特殊网络时，先将整个训练集重新划分为两类，即除了第i类的实例，其它实例都合并为一类，称之为非i类(记为)；将划分后的两类实例集重新输入至全局网络，则可根据每个节点的输出，计算该节点的Fisher值，第j个节点的Fisher计算式子如下：其中与分别是该节点的类间散度和类内散度，Nr是第r类实例的数量，是第r类实例在j节点所有输出的平均值，是所有实例在j节点所有输出的平均值，而Oj(xr)是实例xr在j节点的输出；一个节点的Fisher值较高则代表着该节点区分i类和类实例的能力较强，否则则能力较弱；只删除最后一层隐层中低Fisher值的节点；将该层所有节点的Fisher值求平均，则该平均值作为第i类特殊网络的阈值，所有Fisher值低于该阈值的节...

【专利技术属性】
技术研发人员：何良华，胡仁杰，罗裕隽，莫文闻，侍海峰，刘洪宇，王予沁，任强，刘晓洁，蔡冠羽，
申请(专利权)人：同济大学，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人