【技术实现步骤摘要】
神经网络模型的量化方法、电子设备及介质
[0001]本申请涉及人工智能
,具体涉及一种神经网络模型的量化方法、图像识别方法、电子设备及介质。
技术介绍
[0002]神经网络模型在训练完成后拥有几百甚至上千万的参数,例如每一层网络层中的权重参数和偏置参数等,并且这些参数在存储时都是基于浮点型的32比特位或者更高的比特位进行的。由于这些参数的数据量庞大,在整个卷积计算过程中会消耗大量的存储空间和计算资源。而量化目的就是压缩神经网络模型的大小,方便将神经网络模型部署到手机等计算资源受限的终端上。
[0003]目前的做法是将神经网络模型的上述参数映射至小于32比特位的值域当中,以减少神经网络模型占用的存储空间以及消耗的计算资源,但由于32比特位能够表示的数值范围大于小于32比特位能够表示的数值范围,所以在上述量化过程中,神经网络模型的权重参数或偏置参数会发生缺损,这种方式会造成神经网络模型的精度下降,影响用户的体验。
技术实现思路
[0004]有鉴于此,本申请提供了一种神经网络模型的量化方法、图像识别方法、电子设备及介质能够解决上述技术问题。下面对本申请的量化方法展开介绍。
[0005]第一方面,本申请提供了一种神经网络模型的量化方法,该方法包括:根据待量化数据的量化取值范围和目标值域的值域取值范围,确定将待量化数据量化到目标值域所需的第一量化参数和第二量化参数,其中,第一量化参数对应量化取值范围中大于0的待量化数据,第二量化参数对应量化取值范围中小于0的待量化数据;根据第一量化参数和第 ...
【技术保护点】
【技术特征摘要】
1.一种神经网络模型的量化方法,其特征在于,所述方法包括:根据待量化数据的量化取值范围和目标值域的值域取值范围,确定将所述待量化数据量化到所述目标值域所需的第一量化参数和第二量化参数,其中,所述第一量化参数对应所述量化取值范围中大于0的所述待量化数据,所述第二量化参数对应所述量化取值范围中小于0的所述待量化数据;根据所述第一量化参数和所述第二量化参数,确定所述神经网络模型的第三量化参数;根据所述第三量化参数将所述待量化数据量化至所述目标值域。2.根据权利要求1所述的方法,其特征在于,所述待量化数据包括以下任意一种或多种:构成所述神经网络模型的多个网络层中,任意一层或多层网络层中的权重参数以及偏置参数;或任意一层或多层网络层的输入数据。3.根据权利要求2所述的方法,其特征在于,所述输入数据包括图像数据。4.根据权利要求1所述的方法,其特征在于,所述第一量化参数对应的所述量化取值范围中的待量化数据等于0。5.根据权利要求1或4所述的方法,其特征自在于,所述第二量化参数对应的所述量化取值范围中的待量化数据等于0。6.根据权利要求1所述的方法,其特征在于,所述目标值域的取值范围包括正值区间和负值区间,以及所述根据待量化数据的量化取值范围和目标值域的值域取值范围,确定将所述待量化数据量化到所述目标值域所需的第一量化参数方法包括:确定所述量化取值范围中大于或等于0的所述待量化数据中的第一最大值,所述第一最大值与所述正值区间的最大值的比值为所述第一量化参数。7.根据权利要求6所述的方法,其特征在于,所述目标值域的取值范围包括正值区间和负值区间,以及所述根据待量化数据的量化取值范围和目标值域的值域取值范围,确定将所述待量化数据量化到所述目标值域所需的第二量化参数方法包括:确定所述量化取值范围中小于0的所述待量化数据中的第一最小值,所述第一最小值与所述负值区间的最小值的比值为所述第二量化参数。8.根据权利要求1所述的方法,其特征在于,所述根据第一量化参数和所述第二量化参数,确定所述神经网络模型的第三量化参数的方法包括:按照预设量,从0开始逐次增加所述第一量化参数的第一权重值,计算每个所述第一权重值对应的第一量化参数与第二权重值对应的第二量化参数的和,...
【专利技术属性】
技术研发人员:许礼武,余宗桥,韩冥生,
申请(专利权)人:安谋科技中国有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。