一种用于深度神经网络高速实时量化结构和运算实现方法技术

技术编号：20119400 阅读：35 留言：0更新日期：2019-01-16 12:21

本发明专利技术涉及一种用于深度神经网络高速实时量化结构和运算实现方法，被处理数据通过深度神经网络得到处理结果在深度神经网络选取部分或全部节点作为计算模块，计算模块内的节点参数为或量化为2的整数倍次幂形式的参数，将计算模块的输入数据与2的整数倍次幂形式的参数进行运算得到输出结果。本发明专利技术可以简化计算所消耗的资源，降低系统需求。

A High Speed Real-time Quantization Architecture and Operational Implementation Method for Deep Neural Networks

The present invention relates to a high-speed real-time quantization structure and operation realization method for deep neural network. The processed data are obtained by deep neural network. Some or all nodes are selected as calculation module in deep neural network. The parameters of nodes in the calculation module are in the form of integer power of 2 or 2, and the input data of the calculation module is multiplied by 2 integer power. The output results are obtained by calculating the parameters in the power form. The invention can simplify the resources consumed by calculation and reduce the system requirement.

全部详细技术资料下载

【技术实现步骤摘要】
一种用于深度神经网络高速实时量化结构和运算实现方法
本专利技术为一种深度神经网络量化结构和方法。深度神经网络可以应用在图像识别，语音识别，大数据分析等方面。
技术介绍
深度神经网络是基于学习的方法的一种，其通过逐层抽象特征,组合底层抽象形成高层特征抽象,来发现数据的特征,解决不同的数据表示问题。其拓扑结构和计算方式模拟人脑神经系统,事实证明可准确地感知数据特征。深度神经网络包括CNN，DNN，RNN等结构。近年基于深度神经网络的方法的目标图像识，语音识别，大数据分析等方面别得到很好的效果。在2006年多伦多大学教授Hinton基于深度网络提出了一种快速逐层非监督训练算法，为多层神经网络训练方法做出了革命性的进展，Hinton也因此被称为深度学习之父。2012年,AlexKrishevsky与来自多伦多大学(UniversityofToronto)的其他研究人员提出了一种基于CNN的深度架构AlexNet，赢得了当年的ILSVRC冠军(错误率16.4％使用额外数据可达15.3％)。他们竞争对手以及之前几年的模型相比在识别性能方面取得了实质性的提升。随后，ILSVRC的Top-5错误率在近几年取得重大突破，而主要的突破点都是在深度学习和卷积神经网络，成绩的大幅提升几乎都伴随着卷积神经网络的层数加深。现在，国际的Google，IBM，百度，Intel等领先的科技互联网和硬件公司都将深度网络人工智能方向作为重点发展方向。但是深度神经网络结构复杂，规模大，计算量高，对应用深度神经网络的使用条件提出较高要求，这成为现在主要问题之一。传统深度神经网络中主要运算是乘法运算...

【技术保护点】
1.一种用于深度神经网络高速实时量化结构和运算实现方法，其特征在于：在深度神经网络选取部分或全部节点作为计算模块，计算模块内的节点参数为或量化为2的整数倍次幂形式的参数，将计算模块的输入数据与2的整数倍次幂形式的参数进行运算得到输出结果。

【技术特征摘要】
1.一种用于深度神经网络高速实时量化结构和运算实现方法，其特征在于：在深度神经网络选取部分或全部节点作为计算模块，计算模块内的节点参数为或量化为2的整数倍次幂形式的参数，将计算模块的输入数据与2的整数倍次幂形式的参数进行运算得到输出结果。2.根据权利要求1所述一种用于深度神经网络高速实时量化结构和运算实现方法，其特征在于所述2的整数倍次幂形式的参数包括绝对值大于1的数。3.根据权利要求1所述一种用于深度神经网络高速实时量化结构和运算实现方法，其特征在于所述计算模块的输入数据与2的整数倍次幂形式的参数进行运算具体为：计算模块的输入数据与2的整数倍次幂形式的参数相乘时在处理器中采用位移运算。4.根据权利要求1所述一种用于深度神经网络高速实时量化结构和运算实现方法，其特征在于所述2的整数倍次幂形式的参数为计算模块提出公共系数后，进行量化所得结果。5.根据权利要求1所述一种用于深度神经网络高速实时量化结构和运算实现方法，其特征为所述2的整数倍次幂形式的参数为直接通过训练约束所得结果。6.根据权利要求1所述一种用于深度神经网络高速实时量化结构和运算实现方法，其特征为所述量化包括以下步骤：1)设定量化参数个数M，占全体量化参数个数的a％个数值中，选取绝对值最大的N个参数值Fm-n…Fm；2)计算Fm-n…Fm的平均值Fma；3)设Fma为量化最大值；4)设量化为K级，即2的0次幂至2的K次幂，并将Fma与2的K次幂的...

【专利技术属性】
技术研发人员：周广超，罗海波，惠斌，
申请(专利权)人：中国科学院沈阳自动化研究所，
类型：发明
国别省市：辽宁,21

全部详细技术资料下载我是这个专利的主人