一种基于查表计算的高精度的神经网络工程化方法技术

技术编号：20026714 阅读：30 留言：0更新日期：2019-01-06 05:27

本发明专利技术公开的是一种基于查表计算的高精度的神经网络工程化方法，属于于人工智能神经网络深度学习技术领域，该方法包括步骤：以输出精度作为评价指标，采用自适应搜索策略，对神经网络进行稀疏化；对神经网络的权值参数采用非线性量化，对数据进行索引量化；采用查表法来快速实现神经网络的前向计算，本发明专利技术通过稀疏率自动分配策略在达到设定稀疏率的情况下最大可能的保留的网络精度，使用权值参数非线性量化和数据索引量化策略，将量化宽度压缩到8bit及其以下的同时保存很高的计算精度，最后通过构造一个256x256的32bit高精度快速计算表，实现前向过程的加速并减少运算过程中的精度没有丢失，计算精度高、运算速度快。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于查表计算的高精度的神经网络工程化方法
本专利技术涉及一种神经网络工程化方法，更具体一点说，涉及一种基于查表计算的高精度的神经网络工程化方法，属于人工智能神经网络深度学习

技术介绍
人工神经网络(ArtificialNeuralNetwork，即ANN)是一种运算模型，它是20世纪80年代以来人工智能领域兴起的研究热点，主要由大量的节点(称神经元相互联接构成，其中每个节点代表一种特定的输出函数，称为激励函数(activationfunction)，每两个节点间的连接都代表一个对于通过该连接信号的加权值，称之为权重，这相当于人工神经网络的记忆。网络的输出则依赖网络的连接方式，权重值和激励函数的不同而不同。典型的神经网络由输入层、隐藏层和输出层构成，而深度学习指的是含有多个隐藏层的神经网络结构，堆叠的隐藏层层数就是所谓的网络深度。研究发现网络模型深度越深，相应理解力就越强，现在的深度学习神经网络已经达到几百层至上千层的规模。深度神经网络中从输入层开始，根据输入数据和对应连接线上的权值参数，算出其后隐藏层的所有节点单元的输出值，在算完前一个隐藏层后，继续计算后一个隐藏层，这样从前往后逐渐一层一层的计算神经元节点值，直到最后一层输出层为止，也就是说，把网络正向的走一遍：输入层--->隐藏层--->输出层，计算每个结点，这个过程叫做前向计算。深度学习网络模型的层数深、参数多、计算量大，往往需要借助于GPU才能够运行，所以在嵌入式终端设备上部署的时候，在存储空间、计算资源和内存消耗等多个方面都遇到瓶颈，要想让深度学习网络模型...

【技术保护点】
1.一种基于查表计算的高精度的神经网络工程化方法，其特征在于该方法包括如下步骤：S1:基于原始的浮点网络模型，选取部分样本数据作为测试集输入的神经网络，对该神经网络从输入层到隐藏层再到输出层前向计算一遍，并将输出层获得的精度作为基准精度，根据实际需要设定精度损失门限值A，并设定稀疏率B作为下降的搜索步长；S2：采用步骤S1中设定的搜索步长，将作为测试集输入的神经网络从输入层到隐藏层再到输出层正向完成一次稀疏率下调，以完成一次稀疏率下调后的神经网络作为输入，从该神经网络的输入层到隐藏层再到输出层前向计算一遍，并从输出层获得稀疏精度，将所述稀疏精度与基准精度进行比较，若精度损失小于设定的精度损失门限值A，则重复上述步骤，直至精度损失大于设定的精度损失门限值A；S3:将完成稀疏化处理后的神经网络的权值参数聚类成256个不同的权值质心，将256个权值质心构成一个长度为256的质心队列，并且将每一个权值参数用一个8bit的索引来表明其对应的质心队列中的位置，获得256个权值参数索引；S4：基于原始的浮点网络模型，以步骤S1中作为测试集输入的神经网络作为输入，分别统计神经网络每一层数据的数据范围，...

【技术特征摘要】
1.一种基于查表计算的高精度的神经网络工程化方法，其特征在于该方法包括如下步骤：S1:基于原始的浮点网络模型，选取部分样本数据作为测试集输入的神经网络，对该神经网络从输入层到隐藏层再到输出层前向计算一遍，并将输出层获得的精度作为基准精度，根据实际需要设定精度损失门限值A，并设定稀疏率B作为下降的搜索步长；S2：采用步骤S1中设定的搜索步长，将作为测试集输入的神经网络从输入层到隐藏层再到输出层正向完成一次稀疏率下调，以完成一次稀疏率下调后的神经网络作为输入，从该神经网络的输入层到隐藏层再到输出层前向计算一遍，并从输出层获得稀疏精度，将所述稀疏精度与基准精度进行比较，若精度损失小于设定的精度损失门限值A，则重复上述步骤，直至精度损失大于设定的精度损失门限值A；S3:将完成稀疏化处理后的神经网络的权值参数聚类成256个不同的权值质心，将256个权值质心构成一个长度为256的质心队列，并且将每一个权值参数用一个8bit的索引来表明其对应的质心队列中的位置，获得256个权值参数索引；S4：基于原始的浮点网络模型，以步骤S1中作为测试集输入的神经网络作为输入，分别统计神经网络每一层数据的数据范围，获得神经网络每一层数据中的最大值fmax、最小值fmin，根据神经网络每一层数据中的最大值fmax、最小值fmin以及量化位宽计算出量化步长fstep，再通过神经网络每一层数据的量化步长fstep以及最大值fmax与最小值fmin间的浮点值fdata计算获得该浮点值fdata对应的量化索引index，其中所述神经...

【专利技术属性】
技术研发人员：葛益军，
申请(专利权)人：杭州雄迈集成电路技术有限公司，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人