神经网络权重参数的编码方法、编码器及神经网络处理器技术

技术编号：34264737 阅读：9 留言：0更新日期：2022-07-24 14:38

本发明专利技术公开了一种神经网络权重参数的编码方法、编码器及神经网络处理器，所述编码方法包括：获取若干原始神经网络权重参数，并对各原始神经网络权重参数进行分组，获得若干参数组；将参数组内的参数划分为若干子向量，并将各子向量进行聚类，生成每一类子向量所对应原型向量、每一原型向量的索引值以及每一类子向量中各子向量所对应的缩放因子；将子向量所对应的原型向量的索引值以及缩放因子作为子向量的编码值，对各参数组内的子向量进行编码。通过实施本发明专利技术能够降低原始神经网络权重参数的数据量。参数的数据量。参数的数据量。

Coding method, encoder and neural network processor of neural network weight parameters

全部详细技术资料下载

【技术实现步骤摘要】
神经网络权重参数的编码方法、编码器及神经网络处理器

[0001]本专利技术涉及计算机
，尤其涉及一种神经网络权重参数的编码方法、编码器及神经网络处理器。

技术介绍

[0002]深度神经网络(DNN)为机器学习(Meaching Learning,ML)领域带来了重要突破，通过引入DNN提高了大多数机器学习任务的最优性能。DNN显著的识别效果是以庞大的模型计算量和存储量为代价的，以CNN为例，用于目标检测任务的典型CNN模型(YOLOV3)需要高达320亿次浮点运算操作(Floating
‑
point Operations,FLOP)和60MB以上的模型参数，这使得它们难以部署到硬件资源有限，能量预算紧张的嵌入式设备中。许多为人工智能应用任务设计的专用处理器芯片(AI芯片)也涌现出来。AI芯片内部专门负责实现AI运算和AI应用的模块称为神经网络处理器(Neural
‑
network Processing Unit,NPU)。由于NPU访问存储器的速度无法跟上运算部件消耗数据的速度，再增加运算部件也无法得到充分利用，即形成“内存墙”问题。解决该问题的方向之一是减少访问存储器的数据量，而要减少访问存储器的数据量，就需要减少神经网络权重参数的数据量，因此如何减少神经网络权重参数的数据量是一个亟需解决的问题。

技术实现思路

[0003]本专利技术实施例提供一种神经网络权重参数的编码方法、编码器及神经网络处理器，能降低神经网络权重参数的数据量。
[0004]本专利...

【技术保护点】

【技术特征摘要】
1.一种神经网络权重参数的编码方法，其特征在于，包括：获取若干原始神经网络权重参数，并对各原始神经网络权重参数进行分组，获得若干参数组；将参数组内的参数划分为若干子向量，并将各子向量进行聚类，生成每一类子向量所对应原型向量、每一原型向量的索引值以及每一类子向量中各子向量所对应的缩放因子；将子向量所对应的原型向量的索引值以及缩放因子作为子向量的编码值，对各参数组内的子向量进行编码。2.如权利要求1所述的神经网络权重参数的编码方法，其特征在于，所述将参数组内的参数划分为若干子向量，并将各子向量进行学习聚类，生成每一类子向量所对应原型向量、每一原型向量的索引值以及每一类子向量中各子向量所对应的缩放因子，具体包括：根据参数组内的参数生成一维向量；初始化子向量的数目，根据子向量的数目将一维向量划分为若干子向量；初始化若干初始原型向量、每一初始原型向量的索引值以及每一子向量的初始缩放因子，根据各初始原型向量、各初始原型向量的索引值以及各初始缩放因子构建子向量的初始拟合模型；迭代调整子向量的数目、各初始原型向量、各索引值以及各初始缩放因子，以对初始拟合模型进行迭代训练，直至预设损失函数的函数值最小，生成参数组中每一子向量所对应的原型向量、每一原型向量的索引值以及每一子向量所对应的缩放因子。3.如权利要求1所述的神经网络权重参数的编码方法，其特征在于，所述对若干原始神经网络权重参数进行分组，具体包括：根据各原始神经网络权重参数所属的卷积核，将同一卷积核的原始神经网络权重参数分为一组。4.如权利要求1
‑
3任意一项所述的神经网络权重参数的编码方法，其特征在于，还包括：根据各原型向量以及各原型向量的索引值生成原型向量查找表。5.一种编码器，其特征在于，所述编码器，用于获取若干原始神经网络权重参数，并对各原始神经网络权重参数进行分组，获得若干参数组；将参数组内的参数划分为若干子向量，并...

【专利技术属性】
技术研发人员：王彦飞，濮亚男，胡胜发，
申请(专利权)人：广州安凯微电子股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人