The invention provides a method and a system for fixed-point optimization of convolution neural network, which comprises the following steps: quantizing the pre-trained convolution neural network, quantizing the input of the convolution neural network into fixed-point numbers of N bits, quantifying the parameters in the convolution kernel into numbers in the preset set, and selecting the preset set. The training steps are as follows: control the parameters of the convolution layer unchanged, train the quantized convolution neural network; convolution operation steps: input the trained convolution neural network into the convolutor, the input of the convolutor is the fixed number of n N bits and the parameters of N 4 bits convolution kernel, after displacement The input n input tree cascade adder, the n is the number of convolution kernels. The invention improves operation efficiency, reduces power consumption and ensures the accuracy of prediction results.
【技术实现步骤摘要】
卷积神经网络定点化优化的方法及系统
本专利技术涉及卷积神经网络
,具体地,涉及卷积神经网络定点化优化的方法及系统。
技术介绍
随着计算能力剧增,人工智能获得了巨大的发展,深度学习作为机器学习的新兴领域,起源对人工神经网络的进一步研究,为生物科学和计算机科学相互交叉渗透的产物,其处理复杂抽象的学习问题上表现很好,因此迅速风靡于学术界。然而,典型深度神经网络百万、千万或上亿数量级的参数数量使其对计算和存储设备有较高要求,因此部署网络模型时需要面对多个问题,如模型存储困难以及计算时模型参数传输困难等。因此,深度神经网络的海量参数和所需的计算量均限制了其实际应用,特别是移动设备上的应用,其带来的代价是服务端资源的巨大消耗。目前,随着嵌入式设备的普及,将神经网络部署在这些设备上能够大大减轻服务器的运算压力以及带宽压力。定点化是一种硬件上常用提高乘法加法效率的方法,又因为卷积神经网络的预测精度对参数变化不敏感,因此近年来定点化逐渐被用于硬件加速卷积神经网络。然而,普通的定点化操作仍然需要很多乘法加法的开销,因此二值神经网络被提出,这是一种参数均为+1,-1的网络,能将乘法操作摒除,然而这种方法会大大降低网络的精度。
技术实现思路
针对现有技术中的缺陷,本专利技术的目的是提供一种卷积神经网络定点化优化的方法及系统。根据本专利技术提供的一种卷积神经网络定点化优化的方法,包括:量化步骤:将预训练过的卷积神经网络进行量化,将卷积神经网络的输入量化为Nbits的定点数,将卷积核中的参数量化为预设集合中的数,选择与所述预设集合中欧式距离最近的数进行量化;训练步骤:控制卷积层参数 ...
【技术保护点】
1.一种卷积神经网络定点化优化的方法,其特征在于,包括:量化步骤:将预训练过的卷积神经网络进行量化,将卷积神经网络的输入量化为N bits的定点数,将卷积核中的参数量化为预设集合中的数,选择与所述预设集合中欧式距离最近的数进行量化;训练步骤:控制卷积层参数不变,训练量化后的卷积神经网络;卷积运算步骤:将经过训练的卷积神经网络输入卷积器,所述卷积器的输入为n个N bits的定点数以及n个4bits的卷积核参数,经过位移器输入n输入树形级联加法器,所述n为卷积核的数量。
【技术特征摘要】
1.一种卷积神经网络定点化优化的方法,其特征在于,包括:量化步骤:将预训练过的卷积神经网络进行量化,将卷积神经网络的输入量化为Nbits的定点数,将卷积核中的参数量化为预设集合中的数,选择与所述预设集合中欧式距离最近的数进行量化;训练步骤:控制卷积层参数不变,训练量化后的卷积神经网络;卷积运算步骤:将经过训练的卷积神经网络输入卷积器,所述卷积器的输入为n个Nbits的定点数以及n个4bits的卷积核参数,经过位移器输入n输入树形级联加法器,所述n为卷积核的数量。2.根据权利要求1所述的卷积神经网络定点化优化的方法,其特征在于,所述预设集合为{-0.125,-0.25,-0.5,-1,-2,-4,-8,0.125,0.25,0.5,1,2,4,8}。3.根据权利要求1所述的卷积神经网络定点化优化的方法,其特征在于,所述4bits的卷积核参数中的1bit卷积核参数的符合位。4.根据权利要求1所述的卷积神经网络定点化优化的方法,其特征在于,所述卷积器中的位移器为n个并行位移器,或者多次复用一个移位器达代替n个并行移位器。5.根据权利要求1所述的卷积神经网络定点化优化的方法,其特征在于,所述训练步骤之前还包括采用fine-tune微调方法微调量化后的卷积神经网络。...
【专利技术属性】
技术研发人员:王琴,柳泽辰,蒋剑飞,绳伟光,景乃锋,
申请(专利权)人:上海交通大学,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。