数据的量化装置及量化方法制造方法及图纸

技术编号：20449291 阅读：28 留言：0更新日期：2019-02-27 03:13

本公开提供了一种数据的量化方法，可以挖掘层间数据之间的相似性以及层内数据局部相似性，以挖掘数据分布特性从而进行低比特量化，减小了表示每一个数据的比特数，从而降低了数据存储开销和访存开销。此外，本公开还提供了一种数据的量化装置，集成了量化方法，用于量化数据。基于同一构思，本公开还提供了一种处理装置和处理方法，其中，处理装置能够处理量化后的网络，减少网络数据传输，减少数据传输能耗。此外，处理装置/处理方法不局限于和量化装置/量化方法相对应。

全部详细技术资料下载

【技术实现步骤摘要】
数据的量化装置及量化方法
本公开涉及神经网络领域，尤其涉及一种数据的量化装置及量化方法、处理装置及处理方法。
技术介绍
对神经网络(neuralnetwork)的权值进行量化(quantization)，能够减少表示每一个权值的比特数，从而降低权值存储开销和访存开销。但是传统的量化方法仅仅按照神经网络的层为单位进行量化，并没有挖掘神经网络层间权值的相似性以及层内权值局部相似性，在使用低比特数表示权值的同时，会降低神经网络的精度。因此，如何充分挖掘神经网络的权值分布特性进行低比特量化成为一个亟待解决的问题。公开内容(一)要解决的技术问题本公开的目的在于提供一种数据的量化装置及量化方法、处理装置及处理方法，以解决上述的至少一项技术问题。(二)技术方案本公开的一方面，提供了一种数据的量化方法，包括步骤：对权值进行分组；对每一组权值用聚类算法进行聚类操作，将一组权值分成m个类，每个类计算出一个中心权值，每个类中的所有权值都用中心权值替换，其中，m为正整数；以及对中心权值进行编码操作，得到密码本和权值字典。在本公开的一些实施例中，还包括步骤：对神经网络进行重训练，重训练时只训练密码本，权值字典内容保持不变。在本公开的一些实施例中，所述重训练采用反向传播算法。在本公开的一些实施例中，所述分组包括分为一组、层类型分组、层间分组和/或层内分组。在本公开的一些实施例中，所述聚类算法包括K-means、K-medoids、Clara和/或Clarans。在本公开的一些实施例中，所述分组为分为一组，将神经网络的所有权值归为一组。在本公开的一些实施例中，所述分组为层类型分组，对i...

【技术保护点】
1.一种数据的量化方法，包括步骤：对权值进行分组；对每一组权值用聚类算法进行聚类操作，将一组权值分成m个类，每个类计算出一个中心权值，每个类中的所有权值都用中心权值替换，其中，m为正整数；以及对中心权值进行编码操作，得到密码本和权值字典。

【技术特征摘要】
1.一种数据的量化方法，包括步骤：对权值进行分组；对每一组权值用聚类算法进行聚类操作，将一组权值分成m个类，每个类计算出一个中心权值，每个类中的所有权值都用中心权值替换，其中，m为正整数；以及对中心权值进行编码操作，得到密码本和权值字典。2.根据权利要求1所述的量化方法，其中，还包括步骤：对神经网络进行重训练，重训练时只训练密码本，权值字典内容保持不变。3.根据权利要求2所述的量化方法，其中，所述重训练采用反向传播算法。4.根据权利要求1至3中任一所述的量化方法，其中，所述分组包括分为一组、层类型分组、层间分组和/或层内分组。5.根据权利要求1至4中任一所述的量化方法，其中，所述聚类算法包括K-means、K-medoids、Clara和/或Clarans。6.根据权利要求4或5所述的量化方法，其中，所述分组为分为一组，将神经网络的所有权值归为一组。7.根据权利要求4或5所述的量化方法，其中，所述分组为层类型分组，对i个卷积层，j个全连接层，m个LSTM层，t种不同类型的层，其中，i，j，m为大于等于0的正整数，且满足i+j+m≥1，t为大于等于1的正整数且满足t＝(i＞0)+(j＞0)+(m＞0)，将神经网络的权值将被分为t组。8.根据权利要求4或5所述的量化方法，其中，所述分组为层间分组，将神经网络中一个或者多个卷积层的权值、一个或者多个全连接层的权值和一个或者多个长短时记忆网络层的权值各划分成一组。9.根据权利要求4或5所述的量化方法，其中，所述分组为层内分组，将神经网络的卷积层作为一个四维矩阵(Nfin，Nfout，Kx，Ky)，其中，Nfin，Nfout，Kx，Ky是正整数，Nfin表示输入特征图像数量，Nfout表示输出特征图像数量，(Kx，Ky)表示卷积核的大小，卷积层的权值按(Bfin，Bfout，Bx，By)...

【专利技术属性】
技术研发人员：不公告发明人，
申请(专利权)人：上海寒武纪信息科技有限公司，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人