用于提升深度学习网络预测性能的方法、装置及存储介质制造方法及图纸

技术编号：20426050 阅读：45 留言：0更新日期：2019-02-23 08:48

本申请涉及一种用于提升深度学习网络预测性能的方法、装置及储存介质，属于人工智能及计算机技术领域，该方法包括：利用预先设置的训练集对第一神经网络模型进行m轮次迭代训练；利用预先设置的验证集对训练得到的神经网络模型进行验证；基于训练得到的神经网络模型所应用的场景确定出对应的性能指标；从m轮次迭代训练得到的神经网络模型中选择确定出的性能指标达到融合标准的多个神经网络模型；获取选择的多个神经网络模型的网络参数，将多个神经网络模型的网络参数融合；将融合后的网络参数赋给第二神经网络模型得到具有融合后的网络参数的神经网络模型；不仅未增加训练模型的时间，还可以提高网络预测效率，也可以满足应用场景的不同需求。

全部详细技术资料下载

【技术实现步骤摘要】
用于提升深度学习网络预测性能的方法、装置及存储介质
本申请涉及一种用于提升深度学习网络预测性能的方法、装置及存储介质，属于人工智能及计算机

技术介绍
深度学习是指多层神经网络上运用各种机器学习(MachineLearning)算法解决图像、文本等各种问题的算法集合。深度学习的核心是特征学习，旨在通过分层网络获取分层次的特征信息。为了提高神经网络模型的预测准确性，可通过对多种情况下的神经网络模型进行融合处理。模型融合包括单模型融合和多模型融合。单模型融合包括多层特征融合和网络快照融合，多层特征融合是将不同层具有互补信息的特征进行一定的融合；网络快照融合是利用网络解空间中的各个局部最优解进行模型融合。多模型融合包括基于同一神经网络模型不同初始化网络参数的多模型融合、基于同一神经网络模型不同训练轮数的多模型融合、基于不同损失函数的多模型融合、基于不同网络结构的多模型融合等。然而，无论是单模型融合还是多模型融合，虽然通过在模型层面的融合能够提升网络的最终预测能力，但是在开发过程中要训练多种情况下的神经网络模型且在预测时要计算多种情况下的神经网络模型的结果，会增加网络模型的训练时间，还会降低网络预测的效率。
技术实现思路
本申请提供了一种用于提升深度学习网络预测性能的方法、装置及存储介质，可以解决通过单模型融合或者多模型融合来提升深度学习网络预测性能时训练时间较长和预测时间较长的问题。本申请提供如下技术方案：第一方面，提供了一种用于提升深度学习网络预测性能的方法，所述方法包括：利用预先设置的训练集对第一神经网络模型进行m轮次迭代训练，所述m为正整数；利用预先设...

【技术保护点】
1.一种用于提升深度学习网络预测性能的方法，其特征在于，所述方法包括：利用预先设置的训练集对第一神经网络模型进行m轮次迭代训练，所述m为正整数；利用预先设置的验证集对训练得到的神经网络模型进行验证，获取每轮训练得到的神经网络模型的多项性能指标；基于所述训练得到的神经网络模型所应用的场景确定出对应的性能指标；从所述m轮次迭代训练得到的神经网络模型中选择确定出的性能指标达到融合标准的多个神经网络模型；获取选择的多个神经网络模型的网络参数，将所述多个神经网络模型的网络参数融合，得到融合后的网络参数；将所述融合后的网络参数赋给第二神经网络模型，得到具有所述融合后的网络参数的神经网络模型，所述第二神经网络模型的网络结构与所述第一神经网络模型的网络结构相同。

【技术特征摘要】
1.一种用于提升深度学习网络预测性能的方法，其特征在于，所述方法包括：利用预先设置的训练集对第一神经网络模型进行m轮次迭代训练，所述m为正整数；利用预先设置的验证集对训练得到的神经网络模型进行验证，获取每轮训练得到的神经网络模型的多项性能指标；基于所述训练得到的神经网络模型所应用的场景确定出对应的性能指标；从所述m轮次迭代训练得到的神经网络模型中选择确定出的性能指标达到融合标准的多个神经网络模型；获取选择的多个神经网络模型的网络参数，将所述多个神经网络模型的网络参数融合，得到融合后的网络参数；将所述融合后的网络参数赋给第二神经网络模型，得到具有所述融合后的网络参数的神经网络模型，所述第二神经网络模型的网络结构与所述第一神经网络模型的网络结构相同。2.根据权利要求1所述的方法，其特征在于，所述将所述多个神经网络模型的网络参数融合，得到融合后的网络参数，包括：根据加权平均法将所述多个神经网络模型的网络参数融合，得到所述融合后的网络参数。3.根据权利要求2所述的方法，其特征在于，所述根据加权平均法将所述多个神经网络模型的网络参数融合，得到所述融合后的网络参数，包括：设定所述验证集的基础性能指标；确定每个选择的神经网络模型的性能指标与所述基础性能指标之间差值，得到性能指标差值；确定各个性能指标差值之间的和，得到性能指标差值和；对于每个选择的神经网络模型，确定所述选择的神经网络模型对应的性能指标差值与所述性能指标差值和之间的商，得到所述选择的神经网络模型在进行网络参数融合时对应的权重值；将每个所述选择的神经网络模型的网络参数与对应的权重值的乘积相加，得到所述融合后的网络参数。4.根据权利要求1至3任一所述的方法，其特征在于，所述从所述m轮次迭代训练得到的神经网络模型中选择确定出的性能指标达到融合标准的多个神经网络模型，包括：将m次迭代轮次按照迭代顺序划分得到k个迭代轮次区间，所述k为小于或等于所述m的正整数；在所述k个迭代轮次区间的每个迭代轮次区间中，确定验证集的性能指标最高的神经网络模型，得到k个神经网络模型。5.根据权利要求4所述的方法，其特征在于，所述m次迭代轮次是经所...

【专利技术属性】
技术研发人员：刘通，牛群遥，朱林，孙茂芬，章勇，曹李军，吴仁良，杨浩，
申请(专利权)人：苏州科达科技股份有限公司，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人