一种求解回归问题的神经网络量化方法技术

技术编号：33965812 阅读：14 留言：0更新日期：2022-06-30 01:26

本发明专利技术涉及神经网络技术领域，公开了一种求解回归问题的神经网络量化方法。本发明专利技术首先获取训练数据集；然后设计一个易于硬件实现的非线性激活函数；再基于该激活函数预训练一个32位浮点型的全连接层神经网络模型；调用预训练模型，将浮点型权重值量化成2的整数次幂的形式，将浮点型偏置值、各层浮点型输入输出以及激活函数的输入输出进行定点量化；最后利用反向传播和梯度下降算法对量化网络模型进行训练。本发明专利技术采用移位求和操作代替神经网络中的乘法运算，并采用了一种电路实现简单的激活函数，在保证网络模型拟合精度的同时，大幅减少了模型推理时的运算量，便于网络模型的硬件实现，同时也加快了回归神经网络的计算速度。同时也加快了回归神经网络的计算速度。同时也加快了回归神经网络的计算速度。

全部详细技术资料下载

【技术实现步骤摘要】
一种求解回归问题的神经网络量化方法

[0001]本专利技术涉及神经网络
，尤其涉及一种求解回归问题的神经网络量化方法。

技术介绍

[0002]随着人工智能技术飞速发展，神经网络不仅被广泛应用在图像识别、目标检测、自然语言处理等分类任务中，也被越来越多的研究者用来解决物理、化学、材料、医学等领域的回归预测问题，如凝聚态物理中的分子动力学计算，研究表明基于神经网络的分子动力学计算比采用传统方法快4～6个数量级。然而，神经网络模型中的乘法运算和非线性激活函数都需要大量的硬件开销和较大的时间延迟。与此同时，相较于分类神经网络，回归神经网络对数值精度要求更高。因此，在回归神经网络模型的硬件实现时，需要更大的硬件开销来保证计算精度，这将导致硬件设备的面积和功耗较大、计算速度较慢，一方面增大了硬件设计的制造成本，另一方面也阻碍了回归神经网络在边缘设备上的部署。
[0003]为了解决上述问题，目前亟需一种求解回归问题的神经网络量化方法，在保证回归神经网络计算精度的同时，减少硬件实现时的资源开销，提高硬件计算的速度。

技术实现思路

[0004]本专利技术提供了一种求解回归问题的神经网络量化方法，能够解决现有技术的问题。通过在训练阶段对回归神经网络中的乘法运算和激活函数进行量化和简化，达到便于硬件实现，降低硬件资源开销，提高硬件计算速度的目的。实现本专利技术目的的技术解决方案为：
[0005]一种求解回归问题的神经网络量化方法，步骤如下：
[0006]S1，获取训练数据集，所述训练数据集包括...

【技术保护点】

【技术特征摘要】
1.一种求解回归问题的神经网络量化方法。其特征在于，包括以下步骤：S1，获取训练数据集，所述训练数据集包括样本数据X和对应的标签Y。S2，设计一个易于硬件实现的非线性激活函数A()。S3，基于激活函数A()和S1中的训练集，预训练一个32位浮点型的全连接层神经网络模型M1。S4，调用S3中的M1模型，将模型的浮点型权重值量化成2的整数次幂的形式，并将模型的浮点型偏置值、各层浮点型输入输出以及激活函数的输入输出进行定点量化，得到量化后的神经网络M2。S5，将训练集输入至S4中的量化网络模型M2，利用损失函数的反向传播和梯度下降，对模型M2进行训练。2.如权利要求1所述的一种求解回归问题的神经网络量化方法，其特征在于，所述步骤S1中，训练集中的样本数据X包括但不限于由原始数据变化得到的适于网络训练的特征数据集。3.如权利要求1所述的一种求解回归问题的神经网络量化方法，其特征在于，所述步骤S2中，设计的易于硬件实现的非线性激活函数A()的表达式为(但不限于)：A()与双曲正切激活函数具有相似的函数图像。在网络模型的硬件实现时，用向右移位的操作代替A()中的除法运算。4.如权利要求1所述的一种求解回归问题的神经网络量化方法，其特征在于，所述步骤S3中，全连接层神经网络模型M1由输入层、隐藏层、输出层组成，隐藏层的计算公式如式(2)所示，包括一个矩阵乘运算和一个非线性激活函数A()，输出层的计算式如式(3)所示：X
i
＝A(X
i
‑1W
i
+B
i
)
ꢀꢀꢀ
(2)X
l
＝X
l
‑1W
l
+B
l
ꢀꢀꢀ
(3)其中，l表示神经网络的层数；X
i
表示第i层的输出；X
i
‑1表示第i层的输入(也是第i
‑
1层的输出)；W
i
是第i层的权重；B
i
是第i层的偏置。5.如权利要求1所述的一种求解回归问题的神经网络量化方法，其特征在于，所述步骤S3中，模型训...

【专利技术属性】
技术研发人员：刘杰，赵卓影，莫平辉，谭紫凌，
申请(专利权)人：湖南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人