一种卷积神经网络量化计算方法及系统技术方案

技术编号:23766766 阅读:75 留言:0更新日期:2020-04-11 20:15
本发明专利技术涉及神经网络算法硬件实现领域,公开了一种卷积神经网络量化计算方法及系统,所述计算方法包括:将卷积神经网络各计算层按照计算精度和算力要求,分别匹配使用多值化量化和多比特量化方式进行量化,将多比特量化后的计算层映射到高精度阵列,进行高精度计算;将多值化量化后的计算层映射到高算力阵列,进行高算力计算,根据高精度计算结果和高算力计算结果结合所述非计算层完成卷积神经网络的计算。本发明专利技术提高卷积神经网络推理的速度,在保证准确率的同时,尽可能地降低网络功耗,具有较高的实用价值和广泛的应用前景。

A convolutional neural network quantization method and system

【技术实现步骤摘要】
一种卷积神经网络量化计算方法及系统
本专利技术涉及神经网络算法硬件实现
,具体涉及一种卷积神经网络量化计算方法及系统。
技术介绍
卷积神经网络在图像识别、目标检测和许多机器学习应用领域显示出巨大的优势。卷积神经网络主要由卷积层、池化层、全连接层级联组成,主要有如下操作,分别为像素块和卷积核之间的卷积操作、为引入非线性而进行的激活操作、为减少特征值而对特征图进行的下采样操作(即池化)以及全连接操作。其中,绝大部分计算量都在卷积层以及全连接层。大型的卷积神经网络,具有庞大的参数集和计算量,为完成庞大的计算量,一般芯片的设计思路是基于冯诺依曼架构上大量增加并行的运算单元,但计算单元和存储器之间的数据搬运消耗了大量的资源。闪存作为一种非易失性存储技术被广泛使用,通常的实现方式为使用浮栅或者电荷捕获结构在场效应晶体管中存储电荷,构成存储单元,存储单元构成阵列用于储存大量数据。根据阵列结构的不同,闪存可分两种:NAND型和NOR型,NOR型闪存(NORFlash)的存储单元以并联的方式连接。NORFlASH可以对其每一个存储单元进行独本文档来自技高网...

【技术保护点】
1.一种卷积神经网络量化计算方法,其特征在于,包括:/n建立卷积神经网络,对级联的各层进行计算层和非计算层划分;/n将卷积神经网络各计算层按照计算精度和算力要求,分别匹配使用多值化量化和多比特量化方式进行量化;/n将多比特量化后的计算层映射到高精度阵列,进行高精度计算;将多值化量化后的计算层映射到高算力阵列,进行高算力计算;/n根据高精度计算结果和高算力计算结果结合所述非计算层完成卷积神经网络的计算。/n

【技术特征摘要】
1.一种卷积神经网络量化计算方法,其特征在于,包括:
建立卷积神经网络,对级联的各层进行计算层和非计算层划分;
将卷积神经网络各计算层按照计算精度和算力要求,分别匹配使用多值化量化和多比特量化方式进行量化;
将多比特量化后的计算层映射到高精度阵列,进行高精度计算;将多值化量化后的计算层映射到高算力阵列,进行高算力计算;
根据高精度计算结果和高算力计算结果结合所述非计算层完成卷积神经网络的计算。


2.根据权利要求1所述的一种卷积神经网络量化计算方法,其特征在于,所述计算层至少包括卷积层和全连接层中的一种。


3.根据权利要求1所述的一种卷积神经网络量化计算方法,其特征在于,所述多值化量化为二值化量化或三值化量化中的一种。


4.根据权利要求3所述的一种卷积神经网络量化计算方法,其特征在于,所述多比特量化为4比特量化、5比特量化、6比特量化、7比特量化和8比特量化中的一种或几种。


5.根据权利要求1所述的一种卷积神经网络量化计算方法,其特征在于,所述各计算层包括卷积层和全连接层;
所述分别匹配使用多值化量化和多比特量化方式进行量化具体包括:
对第一层卷积层和最后一层全连接层采用多比特量化方式进行量化;
对卷积层和全连接层中的其他层采用多值化量化方式进行量化。


6.根据权利要求1所述的一种卷积神经网络量化计算方法,其特征在于,所述非计算层至少包括输入层、池...

【专利技术属性】
技术研发人员:李政达任军郦晨侠吕向东盛荣华徐伟明徐瑞
申请(专利权)人:合肥恒烁半导体有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1