一种神经网络模型压缩方法、系统、装置及可读存储介质制造方法及图纸

技术编号：18351353 阅读：41 留言：0更新日期：2018-07-02 01:12

本发明专利技术公开了一种神经网络模型压缩方法、系统、装置及计算机可读存储介质，所述方法包括利用神经网络裁剪方法对待裁剪神经网络模型进行裁剪得到待量化神经网络模型；利用INQ算法对所述待量化神经网络模型进行量化得到待存储神经网络模型；采用压缩格式存储所述待存储神经网络模型。由此可见，本发明专利技术实施例提供的一种神经网络模型压缩方法，通过对神经网络模型进行裁剪，同时裁剪过后对其采用INQ算法进行量化，在有效的保证压缩后的模型精度没有损失的情况下，可以减小模型尺寸，因此可以解决耗费资源过多的问题，并加速计算。

全部详细技术资料下载

【技术实现步骤摘要】
一种神经网络模型压缩方法、系统、装置及可读存储介质
本专利技术涉及人工智能领域，更具体地说，涉及一种神经网络模型压缩方法、系统、装置及计算机可读存储介质。
技术介绍
当今时代，无论是在日常生活，还是互联网世界，都已经绕不开一个词，AI(ArtificialIntelligence)，即人工智能。AI的应用已经渗透到很多方面，比如人脸识别、语音识别、文本处理、围棋对弈、游戏对战、自动驾驶、图片美化、读唇语、甚至地层断裂的仿真模拟等等。在很多方面，其准确度及处理问题的能力已经超过人类，因此，其有着非常广阔的应用前景及想象空间。在AI领域的算法技术当中，深度学习自从2012年在ImageNet竞赛中以绝对的优势夺冠起，便引起了学术界与工业界的广泛关注，各国科学家、研究人员、企业、网络社区都在大力研究并推动深度学习的神经网络模型的研究与发展。随着深度学习在各个领域取得突破进展，将其应用到实际生活场景的需求也愈发强烈，尤其在今天，移动与便携式电子设备极大地方便了人们生活，而深度学习将极大地提高这些设备的智能性与娱乐性。因此，将深度学习的神经网络模型部署在移动端与嵌入式系统便成为迫切需求。但是，通常情况下深度学习的神经网络模型在实际部署中，模型尺寸通常过大，一般情况下，神经网络模型从几十兆到上百兆不等，这样的文件大小，对于移动端来说，下载时耗费的流量以及带宽影响所导致的传输等待时间过长是用户无法忍受的，而对于一些嵌入式系统，存储空间是非常有限的，可能根本没有足够的存储空间来存储这么大的神经网络模型文件。同时，对计算资源及计算能力要求高。在使用大型神经网络模型进行计算时...
一种神经网络模型压缩方法、系统、装置及可读存储介质

【技术保护点】
1.一种神经网络模型压缩方法，其特征在于，包括：利用神经网络裁剪方法对待裁剪神经网络模型进行裁剪得到待量化神经网络模型；利用INQ算法对所述待量化神经网络模型进行量化得到待存储神经网络模型；采用预设压缩格式存储所述待存储神经网络模型。

【技术特征摘要】
1.一种神经网络模型压缩方法，其特征在于，包括：利用神经网络裁剪方法对待裁剪神经网络模型进行裁剪得到待量化神经网络模型；利用INQ算法对所述待量化神经网络模型进行量化得到待存储神经网络模型；采用预设压缩格式存储所述待存储神经网络模型。2.根据权利要求1所述的方法，其特征在于，所述神经网络裁剪方法包括动态网络裁剪算法。3.根据权利要求2所述的方法，其特征在于，所述利用神经网络裁剪方法对待裁剪神经网络模型进行裁剪得到待量化神经网络模型，包括：S201，确定第一训练数据集、待裁剪网络模型与初始迭代次数，其中所述待裁剪网络模型中每层权重参数对应的第一二值掩码矩阵中的值均初始化为1；S202，利用公式更新每层权重参数；其中表示待剪裁神经网络第k层中角标为(i,j)的权重系数；表示神经网络第k层中角标为(i,j)的权重的第一二值掩码；β为正的学习率；L(·)表示损失函数；⊙表示Hadamard乘积算子；I表示权重系数矩阵Wk的角标范围；S203，利用公式更新每层权重参数对应的第一二值掩码矩阵；其中，ak与bk分别为预设边界；函数hk(·)表示，当权重值的绝对值小于ak时，则二值掩码更新为0；当的绝对值大于bk时，则二值掩码更新为1；当的绝对值介于ak与bk之间时，则的值不做更新；S204，按照预设方式更新迭代次数与学习率；S205，判断当前迭代次数是否大于预设值，若否，则返回S202；若是，则利用本次更新后得到的每层权重参数与本次更新后得到的与每层权重参数对应的第一二值掩码矩阵确定待量化神经网络模型。4.根据权利要求1所述的方法，其特征在于，所述利用INQ算法对所述待量化神经网络模型进行量化得到待存储神经网络模型，包括：S301，确定第二训练集与参考模型，利用所述待量化神经网络模型的权重参数初始化...

【专利技术属性】
技术研发人员：谢启凯，吴韶华，
申请(专利权)人：郑州云海信息技术有限公司，
类型：发明
国别省市：河南,41

全部详细技术资料下载我是这个专利的主人