【技术实现步骤摘要】
DBN的优化方法及装置、存储介质及电子设备
[0001]本专利技术涉及神经网络模型训练
,特别是涉及一种DBN的优化方法及装置、存储介质及电子设备。
技术介绍
[0002]DBN(Deep BeliefNetwork,深度置信网络)是一种概率生成模型,DBN网络是通过逐层贪婪堆叠多个受限玻尔兹曼机(restricted Boltzmann machine,RBM)形成的,具体由3层RBM堆叠而成,其中顶端RBM的输入是上端RBM的隐藏层,第三层RBM通过数据重构后达到输出层,DBN用于分类预测输出时,输出层常连接Softmax层。但是DBN隐藏层数和节点数无法通过简单的控制变量进行观测,因此在对DBN进行训练时,容易影响DBN的训练精度。
技术实现思路
[0003]有鉴于此,本专利技术提供一种DBN的优化方法,通过该方法,可以优化DBN,提高DBN的精度。
[0004]本专利技术还提供了一种DBN的优化装置,用以保证上述方法在实际中的实现及应用。
[0005]一种DBN的优化方法,包括: ...
【技术保护点】
【技术特征摘要】
1.一种DBN的优化方法,其特征在于,包括:获取预先设置的训练集、测试集和验证集;确定所述DBN中的RBM层数;执行所述DBN对应的训练过程;其中,所述训练过程包括:应用所述训练集中的各个训练数据以及预设的PSO算法,对每个所述RBM层数中的RBM进行寻优处理,获得所述DBN中各个已处理的RBM;基于所述测试集中的各个测试数据、各个所述已处理的RBM以及预设的BP算法,对所述DBN进行反向微调;计算对所述DBN进行反向微调后所述DBN的模型误差下降率;当所述DBN的模型误差下降率大于预设的误差阈值时,重新执行所述DBN对应的训练过程,直至当前获得的模型误差下降率不大于所述误差阈值时,得到所述DBN的隐藏层的神经网络状态信息;应用所述验证集中的各个验证数据及所述神经网络状态信息对所述DBN进行性能评估;当所述性能评估的评估结果符合预设的评估要求,完成对所述DBN的优化过程。2.根据权利要求1所述的方法,其特征在于,执行所述DBN对应的训练过程之前,还包括:获取所述训练集中的各个训练数据、所述测试集中的各个测试数据以及所述验证集中的各个验证数据;对各个所述训练数据、测试数据以及验证数据进行数据预处理,获得已处理的训练集、已处理的测试集以及已处理的验证集。3.根据权利要求1所述的方法,其特征在于,所述应用所述训练集中的各个训练数据以及预设的PSO算法,对每个所述RBM层数中的RBM进行寻优处理,获得所述DBN中各个已处理的RBM,包括:确定所述DBN中各个RBM的顺序;基于各个所述RBM的顺序,初始化每个所述RBM中的RBM参数;将各个所述训练数据集依次输入各个所述RBM,并应用所述PSO算法调节各个所述RBM中的RBM参数达到最佳参数,所述DBN中各个已处理的RBM。4.根据权利要求3所述的方法,其特征在于,所述基于所述测试集中的各个测试数据、各个所述已处理的RBM以及预设的BP算法,对所述DBN进行反向微调,包括:将各个所述测试数据输入各个所述已处理的RBM,获得每个所述RBM输出的测试结果;判断所述测试结果是否符合预设的测试要求;当所述测试结果不符合所述测试要求时,应用所述BP算法对所述测试结果进行误差计算,获得误差结果;基于所述误差结果,调节所述DBN中的模型参数,并重新将各个所述测试数据输入各个所述已处理的RBM,直至当前输出的测试结果符合预设的测试要求时,完成对所述DBN的反向微调。5.一种DBN的优化装置,其特征在于,包括:获取单元,用于获取预先设置的训练集、测试集和验证集;确定单元,用于确定所述DBN中的RBM层数;
第一执行单元,用于执行所述DBN对应...
【专利技术属性】
技术研发人员:刘淑贤,
申请(专利权)人:中国银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。