用于神经网络压缩的基于聚类的量化制造技术

技术编号：32618731 阅读：22 留言：0更新日期：2022-03-12 17:48

本发明专利技术公开了用于神经网络(NN)压缩的基于聚类的量化的系统、方法和手段。可以分析NN层中权重张量中的权重分布以识别集群异常值。可以例如使用标量量化和/或向量量化相对于集群异常值对集群内部值进行编码。权重重新排列可以将较高维度的权重张量的权重重新排列为较低维度的矩阵。例如，权重重新排列可以将卷积核扁平化为向量。例如，可以通过将跨信道的一个或多个滤波器视为一个点来保持核之间的相关性。张量可以例如沿输入信道和/或输出信道被分成多个子空间。可以基于重新整形或先前编码的块或矩阵对权重或权重矩阵的当前块执行预测性编码。可以向解码器发信号通知排列、内部值、异常值和/或预测信息以用于压缩的NN的重建。的重建。的重建。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于神经网络压缩的基于聚类的量化
[0001]相关申请的交叉引用
[0002]本申请要求2019年7月2日提交的美国临时专利申请号62/869,754的优先权，该专利申请的全文以引用方式并入本文，如同在本文完整示出一样。

技术介绍

[0003]神经网络表示(NNR)编码系统可用于压缩神经网络模型，例如，以减少此类模型所需的存储和/或传输带宽。NNR编码系统可包括基于块的、基于小波的和/或基于对象的系统。

技术实现思路

[0004]公开了用于神经网络(NN)模型压缩的基于聚类的量化(例如，基于分层或基于k
‑
均值聚类的量化)的系统、方法和手段。NN模型可以是一种用于处理视频、音频、医疗、语音等的NN模型。NN模型可以表示例如数据模型、包括一个或多个参数和/或函数的数学模型等。基于聚类的量化可以分析NN层(例如，卷积NN(CNN)层)和/或集群异常值的参数的张量排列。
[0005]设备诸如编码设备可以使用基于集群的量化来进行NN压缩，并且可以分析NN层中权重张量中的一个或多个NN权重的分布。例如，设备可以识别和/或分离集群外的异常值和集群内的内部值。设备可以使用相对于集群内的内部值识别的和/或分离的集群外的异常值来应用基于聚类的量化，诸如基于K
‑
均值聚类的量化。设备可以根据内部值来对权重张量中的异常值进行检测、移除或分离和/或编码(例如，单独编码)。内部值(例如，移除异常值后的其余权重)可以与异常值分开编码(例如，使用标量量化和/或向量量化)。设备可以使用一个或多个异常...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种编码方法，包括：获得包括与权重矩阵相关联的神经网络(NN)层的NN模型；识别所述权重矩阵的维数；基于所述权重矩阵的所识别的维数，对所述权重矩阵重新整形以减少所述权重矩阵的所述维数；以及基于重新整形的权重矩阵对所述NN层进行编码。2.根据权利要求1所述的方法，其中对所述权重矩阵重新整形包括展平或重新排列所述权重矩阵的所述维数。3.根据权利要求1所述的方法，其中所述权重矩阵的所述维数包括二维、三维或更高维，并且将所述权重矩阵重新整形为一维权重向量。4.根据权利要求1所述的方法，其中所述方法包括：在比特流中传输所述权重矩阵的所识别的维数和减少的维数。5.根据权利要求1所述的方法，其中编码包括执行量化。6.根据权利要求5所述的方法，其中所述量化包括向量量化。7.根据权利要求1所述的方法，所述方法包括：基于所述重新整形的权重矩阵执行预测。8.一种用于编码的装置，包括：处理器，所述处理器被配置为：获得包括与权重矩阵相关联的神经网络(NN)层的NN模型；识别所述权重矩阵的维数；基于所述权重矩阵的所识别的维数，对所述权重矩阵重新整形以减少所述权重矩阵的所述维数；以及基于重新整形的权重矩阵对所述NN层进行编码。9.一种解码方法，包括：获得压缩的神经网络(NN)模型，所述压缩的NN模型包括与...

【专利技术属性】
技术研发人员：李端顺，田东，杨华，贺玉文，
申请(专利权)人：VID拓展公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人