The invention discloses an engineering-based convolutional neural network quantization method, which mainly solves the problems of long time-consuming and low accuracy of the existing technology. The implementation scheme is: 1) downloading the pre-trained convolutional neural network model in floating-point format; 2) defining the quantization layer in the downloaded floating-point network; 3) downloading The quantization layer defined by 2) is called after each batch normalization layer in the loaded floating-point network, and the quantization formula of the input data is constructed to quantify the floating-point input data; 4) In the downloaded floating-point network, the weight quantization formula is constructed to quantify the floating-point weight. Compared with the prior art, the invention can reduce the time cost and storage requirement of the image classification task while maintaining the recognition accuracy, and can be used for the deployment of the dedicated chip FPGA/ASIC hardware platform.
【技术实现步骤摘要】
基于工程化实现的卷积神经网络量化方法
本专利技术属于深度学习
,具体涉及一种卷积神经网络量化方法,可用于专用芯片FPGA/ASIC硬件平台的部署。
技术介绍
深度学习近年来发展迅速,已经被广泛应用到各个领域,特别是计算机视觉、语音识别和自然语言处理领域。卷积神经网络是深度学习的代表,在计算机视觉领域掀起了热潮,凭借其强大的学习能力被广泛应用于图像分类任务中。为了提高图像分类任务的识别准确率,卷积神经网络的层数越来越多,结构越来越复杂。提高识别准确率的同时也付出了巨大的代价,计算复杂度和模型存储需求大量增加,这不利于卷积神经网络在功率预算有限的硬件平台的部署。因此,改进卷积神经网络的算法,降低卷积神经网络的存储需求已成为趋势,从而可以促进卷积神经网络在硬件平台FPGA和ASIC芯片上的应用。目前,将卷积神经网络使用的32位浮点数的数制量化成低位宽的定点数这种方法可以使得硬件资源占用和功耗更少。Gupta,S.在其发表的论文“Deeplearningwithlimitednumericalprecision”(《ComputerScience》,2015)中提出了使用随机舍入的方法对卷积神经网络进行定点数的量化,该方法在网络量化位宽为16的时候也能取得与网络使用32位浮点数时几乎相同的性能。但是在硬件平台中随机数的实现特别复杂,所以该方法不易于部署在硬件平台上。RastegariM.在其发表的论文“XNOR-Net:ImageNetClassificationUsingBinaryConvolutionalNeuralNetworks”(European ...
【技术保护点】
1.一种基于工程化实现的卷积神经网络量化方法,包括:(1)从互联网下载两个已经预训练好的浮点格式卷积神经网络模型;(2)在(1)下载的预训练浮点模型的每一层卷积层和全连接层后面都添加一层自定义的量化层,并用该自定义的量化层对浮点形式的输入数据进行量化,量化的公式为:
【技术特征摘要】
1.一种基于工程化实现的卷积神经网络量化方法,包括:(1)从互联网下载两个已经预训练好的浮点格式卷积神经网络模型;(2)在(1)下载的预训练浮点模型的每一层卷积层和全连接层后面都添加一层自定义的量化层,并用该自定义的量化层对浮点形式的输入数据进行量化,量化的公式为:其中,Convert表示将浮点输入数据转化为定点输入数据,x为浮点输入数据,IL和FL分别表示定点输入数据的整数位宽和小数位宽,round为四舍五入函数,是编程语言的内置函数,2FL表示量化成小数位宽为FL的定点数,-2IL-1表示定点输入数据表示的数值范围的下限,2IL-1-2-FL表示定点输入数据表示的数值范围的上限;(3)对(1)下载的预训练浮点模型中已经训练好的浮点权值进行量化,量化的公式为:其中,Convert表示将浮点权值转化为定点权值,w为浮点权值,IL′和FL′分别表示定点权值的整数位宽和小数位宽,round为四舍五...
【专利技术属性】
技术研发人员:张犁,黄蓉,陈治宇,赵博然,牛毅,石光明,
申请(专利权)人:西安电子科技大学,
类型:发明
国别省市:陕西,61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。