一种神经网络模型交互训练方法、装置及存储介质制造方法及图纸

技术编号：32784381 阅读：24 留言：0更新日期：2022-03-23 19:43

本发明专利技术涉及一种神经网络模型交互训练方法及装置，其方法包括：确定参与交互训练的一个主神经网络，以及至少一个次神经网络；根据所述主神经网络和次神经网络之间的分布差异，确定参与交互训练的目标函数；根据所述目标函数训练所述主神经网络和次神经网络，直至目标函数值达到阈值且趋于稳定，得到训练完成的主神经网络。本发明专利技术提出一种神经网络交互训练方法，同时采用KL散度来度量主网络与次网络的预测概率分布差异，实现主次网络交互学习经验来引导主网络学习，从而获得与次网络相近或略高的性能，也缓解了主网络单独训练时收敛缓慢，容易陷入局部最优，特别在训练样本量限制条件下，网络模型泛化性较弱，检出率偏低等问题。检出率偏低等问题。检出率偏低等问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种神经网络模型交互训练方法、装置及存储介质

[0001]本专利技术属于深度学习
，具体涉及一种神经网络模型交互训练方法、装置及存储介质。

技术介绍

[0002]近几年来深度学习神经网络在计算机视觉，自然语言处理与智能语音识别等领域取得了令人瞩目的成就，各种应用场景越来越成熟，但是在比较复杂的环境下，算法模型往往会表现出不稳定的预测结果，降低应用体验。研究人员发现造成上述问题的主要原因是模型在迭代训练时未充分学习到复杂场景信息，导致预测结果不够精确。
[0003]为了提升网络模型的性能，当前的主流解决方案是通过大量收集各个场景下的有效样本以及数据增广等方法来支撑模型迭代训练，显然足够的样本量可以稳定地提升模型的性能，但同时带来了训练成本的大幅增加，训练样本的制作是一个缓慢的过程，当前主要依靠人工标注获取，效率较低。特别地，在进行网络模型验证和评估时，训练样本有限的情况下，模型输出精度往往不理想，某种程度上影响模型的性能指标，所以需要一种网络模型训练策略缓解上述问题。

技术实现思路

[0004]为解决神经网络在训练样样本有限情况下精度不高，以及训练过程中由于训练环境复杂的情况下神经网络不稳定的问题，在本专利技术的第一方面提供了一种神经网络模型交互训练方法，包括：确定参与交互训练的一个主神经网络，以及至少一个次神经网络；根据所述主神经网络和次神经网络之间的分布差异，确定参与交互训练的目标函数；根据所述目标函数训练所述主神经网络和次神经网络，直至目标函数值达到阈值且趋于稳定，得到训练完成的主神...

【技术保护点】

【技术特征摘要】
1.一种神经网络模型交互训练方法，其特征在于，包括：确定参与交互训练的一个主神经网络，以及至少一个次神经网络；根据所述主神经网络和次神经网络之间的分布差异，确定参与交互训练的目标函数；根据所述目标函数训练所述主神经网络和次神经网络，直至目标函数值达到阈值且趋于稳定，得到训练完成的主神经网络。2.根据权利要求1所述的神经网络模型交互训练方法，其特征在于，所述根据所述主神经网络和次神经网络之间的分布差异，确定参与交互训练的目标函数包括：确定所述主神经网络的监督损失函数；确定主神经网络与每个次神经网络的交互训练的损失函数；根据所述监督损失函数和每个交互训练的损失函数，确定参与交互训练的目标函数。3.根据权利要求2所述的的神经网络模型交互训练方法，其特征在于，所述参与交互训练的目标函数通过如下方法确定：L
01
＝αl
01
+(1
‑
α)D，其中，L
01
表示主神经网络的监督损失函数，α为权重因子，D表示神经网络与每个次网络的交互训练的损失函数。4.根据权利要求3所述的神经网络模型交互训练方法，其特征在于，所述神经网络与每个次网络的交互训练的损失函数通过KL散度度量。5.根据权利要求2所述的神经网络模型交互训练方法，其特征在于，所述主神经网络的监督损失函数为Focal loss函数。6.根据权利要求1至5任一项所述的神经...

【专利技术属性】
技术研发人员：乔少华，
申请(专利权)人：武汉中海庭数据技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人