An artificial neural network quantization method for generating output artificial neural network by quantifying the input artificial neural network (ANN) includes: obtaining the second parameter by quantifying the first parameter of the input artificial neural network; obtaining the sample distribution from the intermediate artificial neural network in which the second parameter obtained from the application of the input artificial neural network has been applied. The decimal length of the sample distribution is obtained by quantifying the obtained sample distribution. A neural network quantization device and a non-temporary computer readable recording medium are also provided.
【技术实现步骤摘要】
神经网络量化方法及装置[相关申请的交叉参考]本申请主张在2017年11月13日在韩国知识产权局提出申请的韩国专利申请第10-2017-0150707号的优先权,所述韩国专利申请的公开内容全文并入本申请供参考。
根据一个或多个示例性实施例的装置及方法涉及一种人工神经网络,且更具体来说,涉及一种用于对人工神经网络进行量化的方法及装置。
技术介绍
人工神经网络(artificialneuralnetwork,ANN)可指用于产生人工神经元(或神经元模型)的互连集合的计算器件或由计算器件执行的方法。人工神经元可通过对输入数据执行简单的运算来产生输出数据,且输出数据可被传送到其他人工神经元。作为人工神经网络的实例,深度神经网络(deepneuralnetwork,DNN)或深度学习架构可具有多层式结构。人工神经网络的各个层可具有参数,且可通过根据多个样本对各个层中的每一者进行训练来产生多个样本分布。
技术实现思路
一个或多个示例性实施例的各个方面提供用于以高的准确性对人工神经网络(ANN)进行量化的方法及装置。根据示例性实施例的一方面,提供一种通过对输入人工神经网络(ANN)进行量化来产生输出人工神经网络的人工神经网络量化方法,所述人工神经网络量化方法包括:通过对所述输入人工神经网络的第一参数进行量化来获得第二参数;从其中已对所述输入人工神经网络应用所获得的所述第二参数的中间人工神经网络获得样本分布;以及通过对所获得的所述样本分布进行量化来获得所获得的所述样本分布的小数长度。根据另一个示例性实施例的一方面,提供一种通过对输入人工神经网络(ANN)进行量化来产生输出人工神 ...
【技术保护点】
1.一种通过对输入人工神经网络进行量化来产生输出人工神经网络的人工神经网络量化方法,其特征在于,所述人工神经网络量化方法包括:通过对所述输入人工神经网络的第一参数进行量化来获得第二参数;从其中已对所述输入人工神经网络应用所获得的所述第二参数的中间人工神经网络获得样本分布;以及通过对所获得的所述样本分布进行量化来获得所获得的所述样本分布的小数长度。
【技术特征摘要】
2017.11.13 KR 10-2017-01507071.一种通过对输入人工神经网络进行量化来产生输出人工神经网络的人工神经网络量化方法,其特征在于,所述人工神经网络量化方法包括:通过对所述输入人工神经网络的第一参数进行量化来获得第二参数;从其中已对所述输入人工神经网络应用所获得的所述第二参数的中间人工神经网络获得样本分布;以及通过对所获得的所述样本分布进行量化来获得所获得的所述样本分布的小数长度。2.根据权利要求1所述的人工神经网络量化方法,其特征在于,获得所述第二参数包括:通过根据给定的小数长度对所述第一参数进行量化来获得量化参数,并计算所述第一参数与所获得的所述量化参数之间的量化误差;基于所计算的所述量化误差来计算所述给定的小数长度的评估值;以及基于与多个小数长度对应的多个评估值来获得所述第二参数的最终小数长度。3.根据权利要求2所述的人工神经网络量化方法,其特征在于,计算所述评估值包括计算所计算的所述量化误差的平方和作为所述评估值;以及获得所述最终小数长度包括确定与所述多个评估值中的最小评估值对应的小数长度作为所述最终小数长度。4.根据权利要求1所述的人工神经网络量化方法,其特征在于,所述输入人工神经网络包括多个层及多个信道,所述多个层及所述多个信道各自具有至少一个参数;以及所述第一参数包括所述多个层及所述多个信道中的每一者的所述至少一个参数中的一个或多个参数。5.根据权利要求4所述的人工神经网络量化方法,其特征在于,所述第一参数包括权重、偏置量、及阈值中的至少一者。6.根据权利要求1所述的人工神经网络量化方法,其特征在于,获得所获得的所述样本分布的所述小数长度包括:将所获得的所述样本分布分离成多个样本群组;将所述多个样本群组分别近似到多个连续机率分布;基于所述多个样本群组及所述多个连续机率分布来获得多个步长;以及基于所获得的所述多个步长来选择所述小数长度。7.根据权利要求6所述的人工神经网络量化方法,其特征在于,将所获得的所述样本分布分离成所述多个样本群组包括:将所获得的所述样本分布分离成包括负样本及零的第一样本群组及包括正样本的第二样本群组。8.根据权利要求6所述的人工神经网络量化方法,其特征在于,将所述样本分布分离成所述多个样本群组包括:将所述样本分布分离成第一样本群组、及第二样本群组;且所述第一样本群组包括负样本,且所述第二样本群组包括零及正样本。9.根据权利要求6所述的人工神经网络量化方法,其特征在于,将所述样本分布分离成所述多个样本群组包括将所述样本分布分离成第一样本群组及第二样本群组;以及所述第一样本群组包括负样本,且所述第二样本群组包括正样本。10.根据权利要求6所述的人工神经网络量化方法,其特征在于,将所述多个样本群组近似包括将所述多个样本群组中的每一者近似到广义伽玛分布、高斯分布或拉普拉斯分布。11.根据权利要求6所述的人工神经网络量化方法,其特征在于,获得所述多个步长包括:根据所述多个连续机率分布中的每一者的步长来获得过载畸变及粒度畸变;以及基于所获得的所述过载畸变及所获得的所述粒度畸变来获得所述多个步长中的每一者。12.根据权利要求6所述的人工神经网络量化方法,其特征在于,选择所述小数长度包括:基于所获得的所述多个步长来获得候选小数长度;以及从所获得的所述候选小数长度中选择一个候选小数长度作为所述小数长度。13.根据权利要求12所述的人工神经网络量化方法,其特征在于,获得所述候选小数长度包括:获得与所获得的所述多个步长相邻的步长对应的小数长度;以及基于所获得的所述小数长度来确定小数长度的范围。14.根...
【专利技术属性】
技术研发人员:金度润,任汉永,金炳秀,成乐祐,林钟汉,河相赫,
申请(专利权)人:三星电子株式会社,
类型:发明
国别省市:韩国,KR
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。