神经网络的训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号：44866807 阅读：18 留言：0更新日期：2025-04-08 00:09

本申请公开了一种神经网络的训练方法、神经网络的训练装置、电子设备及计算机可读存储介质，神经网络的训练方法至少应用于视觉处理场景，包括：将训练样本输入待训练的神经网络，得到神经网络在当前的每项连接权重下的输出结果；训练样本至少包括视觉数据；基于输出结果以及训练样本的标注信息，确定出每项连接权重的第一梯度；针对每项连接权重分别生成定向梯度噪声；对于满足第一梯度与设定梯度阈值的关系要求的目标连接权重，将目标连接权重对应的定向梯度噪声以及第一梯度进行融合，得到融合梯度，并根据融合梯度实现对目标连接权重的更新；重复训练至所得到的神经网络满足设定要求。能够提高神经网络训练效率，降低训练时间，压缩训练成本。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及神经网络训练领域，尤其涉及一种神经网络的训练方法、神经网络的训练装置、电子设备及计算机可读存储介质。

技术介绍

1、随着人工智能领域的发展与大模型的出现，神经网络规模指数级提升，学习数据急速增长，庞大的计算量带来了神经网络的训练成本的急速增长，当前主流大模型训练成本往往高达千万乃至数亿美元，造成了巨大的经济成本消耗。如何发展有效的神经网络训练方法，使其能够快速准确地进行功能实现，提升训练效率，降低训练成本是目前人工智能领域亟待解决的问题。

2、神经网络的训练方式是决定神经网络效率与性能的关键。然而，与快速发展的神经网络的规模不同，神经网络的训练方法发展则较为缓慢，当前主流的神经网络训练方式仍为传统的反向传播算法以及梯度下降算法。当前的神经网络训练方式以减小神经网络的输出结果与训练样本的标注之间的损失函数为目标，通过反向传播算法，计算损失函数的梯度，并利用梯度下降算法，令神经网络的参数沿对应梯度的反方向迭代搜索，使神经网络演化至损失函数的局部极小值，实现例如网络预测、分类、生成等复杂功能。

3、然而，现有...

【技术保护点】

1.一种神经网络的训练方法，至少应用于视觉处理场景，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述输出结果以及所述训练样本的标注信息，确定出每项所述连接权重的第一梯度，包括：

3.根据权利要求1所述的方法，其特征在于，所述定向梯度噪声是由所述定向梯度噪声的初始方向与所述定向梯度噪声的强度相乘得到的；

4.根据权利要求1所述的方法，其特征在于，所述设定梯度阈值包括权重梯度阈值、层梯度阈值以及网络梯度阈值中的至少一种；其中，所述网络梯度阈值大于所述权重梯度阈值以及所述层梯度阈值；

5.根据权利要求4所述的方法，其特征...

【技术特征摘要】

1.一种神经网络的训练方法，至少应用于视觉处理场景，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述输出结果以及所述训练样本的标注信息，确定出每项所述连接权重的第一梯度，包括：

3.根据权利要求1所述的方法，其特征在于，所述定向梯度噪声是由所述定向梯度噪声的初始方向与所述定向梯度噪声的强度相乘得到的；

4.根据权利要求1所述的方法，其特征在于，所述设定梯度阈值包括权重梯度阈值、层梯度阈值以及网络梯度阈值中的至少一种；其中，所述网络梯度阈值大于所述权重梯度阈值以及所述层梯度阈...

【专利技术属性】
技术研发人员：杨冬平，王子群，颜梦玫，
申请(专利权)人：之江实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人