一种基于参数压缩的目标检测深度学习网络优化方法技术

技术编号：21631062 阅读：21 留言：0更新日期：2019-07-17 11:46

本发明专利技术公开了一种于FPGA硬件平台上对深度学习神经网络网络参数进行压缩的方法，具体涉及霍夫曼编码，并结合FPGA硬件资源特点对参数进行量化压缩，这种压缩方式能将原来的参数压缩20％‑30％，从而减小了参数所需的存储空间并加快神经网络前向推理速度，使得在小型化设备实现利用神经网络进行实时性目标检测成为可能。本发明专利技术的步骤为：一、根据参数的数据分布对全精度参数进行重新编码并得到一套数据位数为8bit的码表；二、将分布最多的数据用4bit数据索引来表示，其余分布数据用8bit数据索引表示；三、使用布尔数组来做数据索引的索引；四、检测布尔数组为1的时候通过移位得到分布最高的数据的索引；五、利用4bit或者8bit索引去码表中查找对应真实值。

An Optimal Method of Deep Learning Network for Target Detection Based on Parameter Compression

全部详细技术资料下载

【技术实现步骤摘要】
一种基于参数压缩的目标检测深度学习网络优化方法
本专利技术专利属于神经网络优化领域，尤其涉及一种基于新型参数压缩方法并结合FPGA硬件资源特点，对目标检测深度学习网络优化方法。
技术介绍
深度神经网络是一种效果良好的方法，广泛应用于多种领域。在目标检测应用中常用的卷积神经网络是深度神经网络的一种变化形式。卷积神经网络模型在发展中尺寸不断增大，从而拥有计算密集与参数存储量大的特点，在很多资源受限的设备中无法部署应用。传统神经网络模型使用矩阵的数据结构存储网络参数，且数据采用32bit浮点型形式存储，在这些参数矩阵中不仅有大量的0值，且包含众多高概率重复数据。数据重复后直接存储会导致所需要的存储空间变大，存储效率降低，更重要的是会导致检测的时候读取参数所耗的时间变长，从而检测速度变慢，无法实现实时检测的目的。
技术实现思路
研究表明，采用8bit定点型格式去存储32bit浮点型权重数据，在不大范围降低检测效果的基础上会大幅压缩参数，减少数据存储空间。同时，不是简单地直接存储得到的数据(直接得到的数据中含有大量重复数据)，而是减少重复数据的重复存储，又将进一步压缩参数，减少数据存储空间。因此，本专利技术提出一种基于参数压缩的目标检测深度学习网络优化方法，旨在利用霍夫曼编码规则，并结合FPGA硬件资源特点对参数进行量化压缩，这种压缩方式会随着数据概率分布而有不同的压缩率，从而减小了参数所需的存储空间并加快神经网络前向推理速度，使得在小型化设备实现利用神经网络进行实时性目标检测成为可能。本专利技术目的是根据霍夫曼编码规则，同时利用FPGA硬件资源的特点对参数进行量化压缩...

【技术保护点】
1.一种基于参数压缩的目标检测深度学习网络优化方法，其特征在于，包括如下步骤：步骤一，根据权重数据分布对权重数据进行重新编码并得到一套数据位数为8bit的码表；步骤二，将分布最多的权重数据用4bit数据索引来表示，其余分布的权重数据用8bit数据索引表示；步骤三，使用布尔数组来做数据索引的索引；步骤四，检测布尔数组为1的时候通过移位得到分布最高的权重数据的数据索引；步骤五，利用4bit或者8bit数据索引去码表中查找对应真实值。

【技术特征摘要】
1.一种基于参数压缩的目标检测深度学习网络优化方法，其特征在于，包括如下步骤：步骤一，根据权重数据分布对权重数据进行重新编码并得到一套数据位数为8bit的码表；步骤二，将分布最多的权重数据用4bit数据索引来表示，其余分布的权重数据用8bit数据索引表示；步骤三，使用布尔数组来做数据索引的索引；步骤四，检测布尔数组为1的时候通过移位得到分布最高的权重数据的数据索引；步骤五，利用4bit或者8bit数据索引去码表中查找对应真实值。2.如权利要求1所述的一种基于参数压缩的目标检测深度学习网络优化方法，其特征在于：步骤一中重新编码的具体实现过程如下，将每一层的权重数据分成[2-16，2-15，…，20，21，…，216]32组，对所有权重数据取绝对值，将分布在数组之间的权重数据向左规整到这32组中最邻近的数据中，并做出直方图；然后用边界宽度为8，步进为1的矩形区域划过直方图，重合面积最大的时的权重数据范围，即为权重信息主要集中的部分，将这些权重数据编码到[-12...

【专利技术属性】
技术研发人员：范赐恩，邹炼，黄鑫，郭洋，杜娟，
申请(专利权)人：武汉大学，
类型：发明
国别省市：湖北,42

全部详细技术资料下载我是这个专利的主人