一种大型神经网络并行优化训练方法技术

技术编号：30827448 阅读：11 留言：0更新日期：2021-11-18 12:30

本发明专利技术公开了一种大型神经网络并行优化训练方法，所述方法包括以下步骤：步骤1，初始化大型神经网络；步骤2，对大型神经网络进行最优训练，包括对神经网络单元进行单元训练，根据识别率最高的神经网络单元的参数对其余神经网络单元进行迁移训练，对大型神经网络进行整体训练；步骤3，对大型神经网络进行最差淘汰训练，在保持大型神经网络识别率最优的前提下依次淘汰识别率低的神经网络单元。本发明专利技术通过对大型神经网络进行最优训练和淘汰训练，能够提升大型神经网络的训练速度和训练效果，同时简化大型神经网络的结构，快速训练出单元最优和整体最优的大型神经网络。和整体最优的大型神经网络。和整体最优的大型神经网络。

全部详细技术资料下载

【技术实现步骤摘要】
一种大型神经网络并行优化训练方法

[0001]本专利技术涉及神经网络领域，具体是一种大型神经网络并行优化训练方法。

技术介绍

[0002]人工神经网络（Artificial Neural Networks，简写为ANNs）是一种模仿动物神经网络行为特征，进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度，通过调整内部大量节点之间相互连接的关系，从而达到处理信息的目的，并具有自学习和自适应的能力。为了实现神经网络输出的高准确性，需要对神经网络进行训练。现有神经网络的训练通常都是进行整体训练，向神经网络输入足够多的样本，通过一定算法调整神经网络的结构（调整神经单元之间的连接及权重），使神经网络的输出与预期值相符。
[0003]在构建大型、复杂神经网络时，通常是将现有的已训练好的小型神经网络当作神经单元来构建神经网络，再对大型、复杂神经网络进行整体训练。但现有的已训练好的这些小型神经网络通常是通用模型，在构建一个新需求的大型、复杂神经网络时，不能确保这些小型神经网络良好适配需要构建的大型神经网络。而如果从零开始构建一个全新的大型、复杂神经网络，由于神经单元繁多、结构复杂，现有的训练方法需要较长的时间才能使大型复杂神经网络达到收敛，且现有的训练方法不能很好地优化大型神经网络内神经单元的结构和大型神经神经网络的结构。

技术实现思路

[0004]本专利技术的目的在于解决现有技术的上述问题，提供了一种大型神经网络并行优化训练方法，本专利技术通过对大型神经网络进行最优训练和淘汰训练，能够提升大型...

【技术保护点】

【技术特征摘要】
1.一种大型神经网络并行优化训练方法，其特征在于，所述方法包括以下步骤：步骤1，初始化大型神经网络，包括对神经网络单元的初始化和神经网络单元之间连接结构的初始化；步骤2，对大型神经网络进行最优训练，包括对神经网络单元进行单元训练，根据识别率最高的神经网络单元的参数对其余神经网络单元进行迁移训练，对大型神经网络进行整体训练，在大型神经网络识别率达到设定整体识别率时结束最优训练；步骤3，对大型神经网络进行最差淘汰训练，在保持大型神经网络识别率最优的前提下依次淘汰识别率低的神经网络单元，在神经网络单元数量最少时结束最差淘汰训练。2.根据权利要求1所述的一种大型神经网络并行优化训练方法，其特征在于，所述步骤2包括：步骤21，对大型神经网络中各神经网络单元并行进行单元训练，达到设定训练次数后单元训练结束，选取各个单元训练过程中识别率最高的网络结构定形对应的神经网络单元；如果存在识别率达到设定单元识别率的神经网络单元，则进行步骤22；如果不存在识别率达到设定单元识别率的神经网络单元，则重新初始化神经网络单元内最小节点数量及最小节点间连接关系和权重，然后重复步骤21；步骤22，对于同类别的神经网络单元，将识别率最高的神经网络单元的参数迁移至其余神经网络单元，然后对其余神经网络单元并行进行迁移训练，达到设定训练次数后迁移训练结束，选取各个迁移训练过程中识别率最高的网络结构定形对应的神经网络单元；步骤23，对大型神经网络进行整体训...

【专利技术属性】
技术研发人员：戚建淮，周杰，宋晶，张莉，郑伟范，刁润，
申请(专利权)人：成都市以太节点科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人