【技术实现步骤摘要】
一种面向快速遥感图像处理的深度神经网络模型量化方法
[0001]本专利技术设计属于深度学习及信号处理领域,具体涉及到一种面向快速遥感图像处理的深度神经网络模型量化方法。
技术介绍
[0002]近年来,深度学习成为现代IT技术最热门的一个课题,几乎各领域中都能看到深度学习的影子,包括智能机器翻译、医疗诊断、金融分析以及自动驾驶等,因此在科研领域具有很高的价值以及很强的实用价值。深度学习的“深度”主要指的是模型的层数。网络复杂度不断提升,层次间的复杂度呈几何倍数递增,对应的是对处理器运算能力需求的爆炸式增长。深度学习带来计算量急剧增加,对计算硬件带来更高要求。
[0003]对于快速遥感图像处理需求,由于其分辨率较高、图像较大,一些精细度较高、较为复杂的深度神经网络中大量的高精度浮点参数限制了网络在一些有限资源的计算平台的部署能力。因此,为了满足对遥感图像快速处理的需求,对深度神经网络模型进行量化压缩具有重要的研究意义。
[0004]目前,一种较为成熟的量化方案是训练后8bit量化,已经可以达到与32位浮点数模型几 ...
【技术保护点】
【技术特征摘要】
1.一种面向快速遥感图像处理的深度神经网络模型量化方法,其特征在于:该方法步骤如下:步骤一:基于采样得到的遥感图像样本集,对输入特征裁剪边界基于误差最小化原则进行优化求解,得到网络模型每层输入特征的裁剪阈值;步骤二:基于采样得到的遥感图像样本集,对预训练好的网络模型权重的每个卷积层、卷积层内每个卷积核的位宽变量构建优化方程,并基于层次化搜索方法进行求解,得到模型权重的量化位宽配置;步骤三:根据步骤一和步骤二得到的裁剪阈值和量化位宽,对输入图像进行网络的前向推理,其中对输入特征的量化为推理过程中实时进行,对模型权重的量化在前向推理前完成。2.根据权利要求1所述的一种面向快速遥感图像处理的深度神经网络模型量化方法,其特征在于:所述步骤一具体过程如下:S11、对采样得到的样本集中的图像数据进行拉普拉斯分布拟合,得到所有L个卷积层的形状参数β={β1,β2,
…
β
L
};S12、根据S11步骤计算得到的参数β,构建量化误差均方误差期望的解析方程,采用最小化误差的方法进行优化求解,得到初步优化的裁剪值S13、根据S12步骤计算得到的构建基于最小化输出特征向量距离的优化方程,并在邻域内进行以设定的步长进行搜索,得到输入特征的最优裁剪值S14、保持权重参数的浮点精度不变,从模型的第一个卷积层开始,执行S12与S13步骤得到当前层的最优裁剪阈值,依次循环直到完成所有卷积层输入特征的裁剪阈值的计算。3.根据权利要求1所述的一种面向快速遥感图像处理的深度神经网络模型量化方法,其特征在于:所述步骤二具体过程如下:S21、根据所选的网络结构以及采样得到的样本集,为每个卷积层分配量化位宽变量,根据帕累托优化方法构建多目...
【专利技术属性】
技术研发人员:王海涛,张睿,赵洪博,邹云,贺治钧,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。