【技术实现步骤摘要】
基于移位量化操作的全定点卷积计算方法、系统及设备
本专利技术属于卷积神经网络领域,具体涉及了一种基于移位量化操作的全定点卷积计算方法、系统及设备。
技术介绍
随着深度学习技术的不断发展,以卷积神经网络为代表的一系列模型在图像分类、目标检测等领域取得了良好的效果,并在生活中得到了广泛应用。但目前的卷积运算通常为浮点运算,在模型设计越来越复杂的情况下,浮点计算所带来的内存占用和时间消耗都非常巨大,难以在嵌入式设备上进行部署,因此通常需要将浮点运算量化为定点运算,以提高网络前向推理的效率。现有的量化方法虽然将权值量化为定点数,但在前向推理过程中仍然涉及部分浮点运算,这会给嵌入式设备带来一定的性能损耗,另外,现有量化方法通常对每层卷积层的多个通道分别进行量化,导致每一层需要多个量化参数,这会增加嵌入式设备尤其是FPGA设备调度的复杂性。因此,设计一种更为简洁的全定点卷积计算方法尤为必要。
技术实现思路
为了解决现有技术中的上述问题,即现有的卷积计算只能通过浮点运算,内存占用和时间消耗都非常巨大,难以在嵌入 ...
【技术保护点】
1.一种基于移位量化操作的全定点卷积计算方法,其特征在于,所述方法包括:/n步骤S100,获取校正集图像,并输入浮点模型获得各卷积层输出的特征图;/n步骤S200,基于各卷积层输出的特征图,获取各卷积层特征图的量化尺度参数;/n步骤S300,计算各卷积层的卷积核参数的量化尺度参数;/n步骤S400,基于所述特征图的量化尺度参数和卷积核参数的量化尺度参数计算偏置项参数的量化尺度参数;/n步骤S500,基于所述各卷积层的卷积核参数的量化尺度参数和偏置项参数的量化尺度参数,将各卷积层权重进行量化获得量化后的卷积核参数和量化后的偏置项参数;/n步骤S600,基于所述特征图的量化尺度 ...
【技术特征摘要】
1.一种基于移位量化操作的全定点卷积计算方法,其特征在于,所述方法包括:
步骤S100,获取校正集图像,并输入浮点模型获得各卷积层输出的特征图;
步骤S200,基于各卷积层输出的特征图,获取各卷积层特征图的量化尺度参数;
步骤S300,计算各卷积层的卷积核参数的量化尺度参数;
步骤S400,基于所述特征图的量化尺度参数和卷积核参数的量化尺度参数计算偏置项参数的量化尺度参数;
步骤S500,基于所述各卷积层的卷积核参数的量化尺度参数和偏置项参数的量化尺度参数,将各卷积层权重进行量化获得量化后的卷积核参数和量化后的偏置项参数;
步骤S600,基于所述特征图的量化尺度参数、量化后的卷积核参数和量化后的偏置项参数进行卷积运算获得最终卷积特征。
2.根据权利要求1所述的基于移位量化操作的全定点卷积计算方法,其特征在于,所述计算特征图的量化尺度参数,其具体步骤为:
步骤A10,基于所述各卷积层输出的特征图,获取各卷积层特征图的绝对值最大值;
步骤A20,基于所述各卷积层特征图的绝对值最大值,通过量化尺度参数公式计算各卷积特征图的量化尺度参数;
所述量化尺度参数公式为:
其中,表示参数量化到相应低bit定点数时的最大值,比如量化到8bit有符号
数,则;表示当前待量化的浮点数中的绝对值最大值,在本
步骤中为各卷积层特征图的绝对值最大值;表示量化尺度参数,在本步骤中为各卷积
层特征图的量化尺度参数;表示对数据进行四舍五入。
3.根据权利要求2所述的基于移位量化操作的全定点卷积计算方法,其特征在于,所述计算各卷积层的卷积核参数的量化尺度参数,其具体步骤包括:
步骤B10,统计各卷积层卷积核的绝对值最大值;
步骤B20,基于所述卷积核的绝对值最大值,根据所述量化尺度参数公式生成各卷积层卷积核的量化尺度参数。
4.根据权利要求3所述的基于移位量化操作的全定点卷积计算方法,其特征在于,偏置项参数的量化尺度参数,其获得方法为:
由当前层上一层的特征图的量化尺度参数和当前卷积层的卷积核参数的量化尺度参数加和获得当前卷积层的偏置项的量化尺度参数。
5.根据权利要求4所述的基于移位量化操作的全定点卷积计算方法,其特征在于,所述量化后卷积核参数和量化后的偏置项参数,其获得方法为:
基于各卷积层的卷积核参数的量化尺度参数和偏置项参数的量化尺度参数,通过量化后权重参数公式,分别获得量化后的卷积核参数和量化后的偏置项参数;
所述量化后权重参数公式为:
其中,表示待量化的浮点权重参数;表示量化尺度参数;q表示量化后的权
重参数;表示对数据四舍五入。
6.根据权利要求5所述的基于移位量化操作的全定点卷积计算方法,其特征在于,步骤S600包括:
步骤S610,对于每一层卷积层,将当前卷积层输入的量化后的特征图与...
【专利技术属性】
技术研发人员:尹志刚,张鹏,
申请(专利权)人:中国科学院自动化研究所,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。