一种神经网络量化方法、装置以及相关产品制造方法及图纸

技术编号：21116739 阅读：33 留言：0更新日期：2019-05-16 09:17

本申请提供一种神经网络量化方法、装置及相关产品，所述方法用于对神经网络的计算层的数据进行量化。本申请提供的技术方案具有成本低的优点。

A Neural Network Quantization Method, Device and Related Products

全部详细技术资料下载

【技术实现步骤摘要】
一种神经网络量化方法、装置以及相关产品
本申请涉及信息处理
，具体涉及一种神经网络量化方法、装置以及相关产品。
技术介绍
神经网络在系统辨识、模式识别、智能控制等领域有着广泛而吸引人的前景，特别在智能控制中，人们对神经网络的自学习功能尤其感兴趣，并且把神经网络这一重要特点看作是解决自动控制中控制器适应能力这个难题的关键钥匙之一。现有的神经网络构架均是基于多比特的构架，例如目前常用的32Bit构架，现有的神经网络构架的数据占用的比特位较多，需要较高的存储空间以及处理带宽，提高了成本。
技术实现思路
本申请实施例提供了一种神经网络量化方法及相关产品，可降低神经网络构架的比特位数，降低存储空间以及处理带宽，降低成本。第一方面，提供一种神经网络量化方法,包括：获取原始神经网络的目标量化层的权值和输入数据；其中，所述目标量化层为所述原始神经网络的计算层中的至少一层；利用所述原始神经网络的目标量化层的权值确定对应层的权值的量化参数；利用所述原始神经网络的目标量化层的输入数据确定对应层的输入数据的量化参数；其中，所述目标量化层的权值和输入数据均采用绝对值最大值不失真原则；根据所述权值的量化参数和所述输入数据的量化参数对所述原始神经网络的目标量化层进行量化。第二方面，提供一种神经网络量化装置，所述装置包括：数据读取单元，用于获取原始神经网络的目标量化层的权值和输入数据；其中，所述目标量化层为所述原始神经网络的计算层中的至少一层；量化参数确定单元，用于利用所述原始神经网络的目标量化层的权值确定对应层的权值的量化参数；利用所述原始神经网络的目标量化层的输入数据确定对应层的输...

【技术保护点】
1.一种神经网络量化方法，其特征在于，包括：获取原始神经网络的目标量化层的权值和输入数据；其中，所述目标量化层为所述原始神经网络的计算层中的至少一层；利用所述原始神经网络的目标量化层的权值确定对应层的权值的量化参数；利用所述原始神经网络的目标量化层的输入数据确定对应层的输入数据的量化参数；其中，所述目标量化层的权值和输入数据均采用绝对值最大值不失真原则；根据所述权值的量化参数和所述输入数据的量化参数对所述原始神经网络的目标量化层进行量化。

【技术特征摘要】
1.一种神经网络量化方法，其特征在于，包括：获取原始神经网络的目标量化层的权值和输入数据；其中，所述目标量化层为所述原始神经网络的计算层中的至少一层；利用所述原始神经网络的目标量化层的权值确定对应层的权值的量化参数；利用所述原始神经网络的目标量化层的输入数据确定对应层的输入数据的量化参数；其中，所述目标量化层的权值和输入数据均采用绝对值最大值不失真原则；根据所述权值的量化参数和所述输入数据的量化参数对所述原始神经网络的目标量化层进行量化。2.根据权利要求1所述的神经网络量化方法，其特征在于，所述计算层包括：卷积层、全连接层、LRN归一化层，反卷积层、Reorg层，Normalize归一化层中的至少一种。3.根据权利要求1所述的神经网络量化方法，其特征在于，所述利用所述原始神经网络的目标量化层的权值确定对应层的权值的量化参数的步骤包括：获取所述目标量化层中的每一层的权值的绝对值的最大值；根据所述目标量化层中的每一层的权值的绝对值的最大值确定对应层的权值的第一量化参数和第二量化参数。4.根据权利要求1所述的神经网络量化方法，其特征在于，所述利用所述原始神经网络的目标量化层的输入数据确定对应层的输入数据的量化参数的步骤包括：获取所述目标量化层中的每一层的输入数据的绝对值的最大值；根据所述目标量化层中的每一层的输入数据的绝对值的最大值确定对应层的输入数据的第一量化参数和第二量化参数。5.根据权利要求1所述的神经网络量化方法，其特征在于，所述方法还包括：对所述原始神经网络的目标量化层中的每一层采用第一量化方法、第二量化方法或第三量化方法进行处理；其中，所述第一量化方法包括：利用所述目标量化层中的每一层的权值的第一量化参数将对应层的权值进行量化，获得对应层的权值量化结果；利用所述目标量化层中的每一层的输入数据的第一量化参数将对应层的输入数据进行量化，获得对应层的输入数据量化结果；所述第二量化方法包括：利用所述目标量化层中的每一层的权值的第一量化参数和第二量化参数获得对应层的权值量化中间参数；根据所述权值量化中间参数获得对应层的权值量化结果；利用所述目标量化层中的每一层的输入数据的第一量化参数和第二量化参数获得对应层的输入数据量化中间参数；根据输入数据量化中间参数获得对应层的输入数据量化结果；所述第三量化方法包括：利用所述目标量化层中的每一层的权值的第一量化参数和第二量化参数获得对应层的权值量化结果；利用所述目标量化层中的每一层的输入数据的第一量化参数和第二量化参数获得对应层的输入数据量化结果。6.根据权利要求1所述的神经网络量化方法，其特征在于，所述方法还包括：利用所述目标量化层中的每一层的每个通道的第一权值量化参数和第二权值量化参数获得对应通道的权值量化中间参数；其中，所述目标量化层包括卷积层和/或全连接层，利用每个通道的权值量化中间参数获得对应通道的权值量化结果，所述目标量化层中的每一层的每个通道的权值量化结果构成对应层的权值量化结果；利用所述目标量化层中的每一层的第一输入数据量化参数和第二输入数据量化参数获得对应层的输入数据量化中间参数；利用所述目标量化层中的每一层的输入数据量化中间参数获得对应层的输入数据量化结果。7.根据权利要求6所述的神经网络量化方法，其特征在于，所述方法还包括：对所述原始神经网络的目标量化层中的每一层采用第一量化方法、第二量化方法或第三量化方法进行处理；其中，所述目标量化层还包括所述原始神经网络的计算层中除了卷积层和/或全连接层之外的其他至少一层；所述第一量化方法包括：利用所述目标量化层中的每一层的权值的第一量化参数将对应层的权值进行量化，获得对应层的权值量化结果；利用所述目标量化层中的每一层的输入数据的第一量化参数将对应层的输入数据进行量化，获得对应层的输入数据量化结果；所述第二量化方法包括：利用所述目标量化层中的每一层的权值的第一量化参数和第二量化参数获得对应层的权值量化中间参数；根据所述权值量化中间参数获得对应层的权值量化结果；利用所述目标量化层中的每一层的输入数据的第一量化参数和第二量化参数获得对应层的输入数据量化中间参数；根据输入数据量化中间参数获得对应层的输入数据量化结果；所述第三量化方法包括：利用所述目标量化层中的每一层的权值的第一量化参数和第二量化参数获得对应层的权值量化结果；利用所述目标量化层中的每一层的输入数据的第一量化参数和第二量化参数获得对应层的输入数据量化结果。8.一种神经网络量化装置，其特征在于，所述装置包括：数据读取单元，用于获取原始神经网络的目标量化层的权值和输入数据；其中，所述目标量化层为所述原始神经网络的计算层中的至少一层；量化参数确定单元，用于利用所...

【专利技术属性】
技术研发人员：不公告发明人，
申请(专利权)人：北京中科寒武纪科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人