一种神经网络训练及推理方法、装置、终端及存储介质制造方法及图纸

技术编号：37137402 阅读：19 留言：0更新日期：2023-04-06 21:38

本发明专利技术公开了一种神经网络训练及推理方法、装置、终端及存储介质，包括：对正向传播的网络节点信息进行映射处理，并根据映射后的数值进行伯努利过程采样，将得到的随机二值化数值作为下一层网络的输入；对激活函数的导数进行伯努利过程采样，得到随机二值化后的激活函数的导数；对下一层网络的反向传播的误差进行符号化处理，并根据符号化处理后的值和随机二值化后的导数计算本层网络的误差信息；根据本层网络的误差信息和上一层网络产生的随机二值化输出对本层网络进行训练；根据逐层传播的随机二值化数值进行神经网络的推理。本发明专利技术采用随机二值化的信号进行正向传播和符号化的误差进行反向传播的神经网络，降低计算资源且提高了识别精度。提高了识别精度。提高了识别精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种神经网络训练及推理方法、装置、终端及存储介质

[0001]本专利技术涉及人工智能
，尤其涉及的是一种神经网络训练及推理方法、装置、终端及存储介质。

技术介绍

[0002]人工神经网络(Artificial Neural Network，以下简称神经网络)的技术进步是近年来科技发展的重要推动力。神经网络广泛应用于对图像、声音、文字等信息的处理过程中。
[0003]神经网络中通常包含多层相互连接的非线性网络节点，节点之间的连接强度称为权重。神经网络的所需处理的信息从输入节点输入，在神经网络中逐层传播，最终到达输出层，这一过程称为信息的正向传播。信息的正向传播是神经网络对输入信息的处理过程，又称推理过程。神经网络可以通过特定的算法和流程调整网络中连接各个节点之间的权重，从而使推理结果尽可能地准确，这一过程称为训练或学习过程。
[0004]误差反向传播(Error Backpropagation)和梯度下降算法(Gradient Descent)是实现神经网络训练的重要技术专利技术。基于误差反向传播和梯度下降算法的神经网络训练，包含以下4个步骤：
[0005]1)将训练集中的样本数据输入到神经网络中进行信息的正向传播，获得每个节点的状态信息，并获得最终输出结果；
[0006]2)输出结果与样本数据的标记信息进行对比，获得输出误差(Error)；
[0007]3)将输入误差从网络终端作为输入，由神经网络最后一层向第一层反向传播；
[0008]4)利用正向传播的信息和反向...

【技术保护点】

【技术特征摘要】
1.一种神经网络训练及推理方法，其特征在于，包括：根据激活函数对正向传播的网络节点信息进行映射处理，并根据映射后的数值进行伯努利过程采样，得到本层网络产生的随机二值化数值，将得到的随机二值化数值作为下一层网络的输入；对所述激活函数的导数进行伯努利过程采样，得到随机二值化后的激活函数的导数；对所述下一层网络的反向传播的误差进行符号化处理，并根据符号化处理后的值和所述随机二值化后的激活函数的导数计算所述本层网络的误差信息；根据所述本层网络的误差信息和上一层网络产生的随机二值化输出对本层网络进行训练；根据逐层传播的随机二值化数值进行神经网络的推理。2.根据权利要求1所述的神经网络训练及推理方法，其特征在于，所述根据激活函数对正向传播的网络节点信息进行映射处理，之前包括：获取上一层网络中连接到所述本层网络的各节点的输出信息，得到所有连接所述本层网络的节点的输入；其中，所述本层网络的节点的输入为所述上一层网络的经过随机二值化处理后的输出；将所有连接所述本层网络的节点的输入与对应的权重进行相乘，并将得到的所有乘积进行求和，得到所述本层网络的节点的输入信息。3.根据权利要求1所述的神经网络训练及推理方法，其特征在于，所述根据激活函数对正向传播的网络节点信息进行映射处理，并根据映射后的数值进行伯努利过程采样，得到本层网络产生的随机二值化数值，将得到的随机二值化数值作为下一层网络的输入，包括：根据所述激活函数对所述本层网络的输入信息进行映射处理，将所述本层网络的输入信息映射成0至1之间的数值；以映射得到的数值为概率进行伯努利过程采样，获得对应的随机二值化网络节点的输出结果；其中，所述输出结果为所述本层网络产生的随机二值化数值；将获得的随机二值化网络节点的输出结果作为所述下一层网络的输入。4.根据权利要求1所述的神经网络训练及推理方法，其特征在于，所述激活函数为挤压函数，包括：Logistic函数、误差函数、剪切式整流线性单元函数以及对称剪切式整流线性单元函数中的一种或组合。5.根据权利要求1所述的神经网络训练及推理方法，其特征在于，所述对所述激活函数的导数进行伯努利过程采样，得到随机二值化后的激活函数的导数，包括：获取所述激活函数的导数；以获得的导数为概率进行伯努利过程采样，获得对应的随机二值化网络节点的输出结果；将获得的随机二值化网络节点的输出结果作为反向传播过程的误差信息计算值。6.根据权利要求5所述的神经网络训练及推理方法，其特征在于，所述以获得的导数为概率进行伯努利过程采样，获得对应的随机二值化网络节点的输出结果，之前包括：对所述激活函数的导数的幅值进行等比例缩放或近似化处理。7.根据权利要求1所述的神经网络训练及推理方法，其特征在于，所述对所述下一层网络的反向传播的误差进行符号化处理，并根据符号化处理后的值...

【专利技术属性】
技术研发人员：王伟，李阳，姜文峰，汪令飞，耿玓，刘明，
申请(专利权)人：鹏城实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人