一种针对ReRAM部署神经网络的权重分配方法组成比例

技术编号：38011659 阅读：7 留言：0更新日期：2023-06-30 10:32

本发明专利技术公开了一种针对ReRAM部署神经网络的权重分配方法，属于神经网络技术领域，其方法包括：遍历神经网络结构，将权重进行转换，适配到存算神经网络计算引擎，每层的权重形成一个3维的小立方体；使用3d背包算法，遍历所有的权重立方体，将小立方体放到存算阵列转换的大立方体中，并获取对应的坐标信息。本发明专利技术转换了存算阵列视角，将权重存放问题抽象为传统的3d背包问题，便于使用成熟的算法解决陌生的问题，提高了权重存放的效率；同时适用于多数神经网络的权重存放，可复用性高，更利于神经网络的部署与存算神经网络计算引擎的迭代改进。络的部署与存算神经网络计算引擎的迭代改进。络的部署与存算神经网络计算引擎的迭代改进。

全部详细技术资料下载

【技术实现步骤摘要】
一种针对ReRAM部署神经网络的权重分配方法

[0001]本专利技术涉及神经网络
，尤其涉及一种针对ReRAM部署神经网络的权重分配方法。

技术介绍

[0002]神经网络算法在计算过程中加载权重会占用大量数据带宽，基于ReRAM的存算神经网络计算引擎事先将权重写入计算单元，在执行神经网络算法是仅需要加载特征向量，省去权重的加载，能极大缓解带宽压力释放算力。
[0003]目前基于ReRAM的存内神经网络计算引擎尚处于起步阶段，没有成熟的完整的解决方案。
[0004]该算法中存算颗粒结构如图1所示，其中，一个bank由256行144B的存算单元组成；一个macro由4个bank组成，其中bank之间共享输入的数据/地址，提供4个不同的输出；一个group由16个macro组成。该算法描述4 group的情况，即存算颗粒总共包含256bank。rowBank表示并行放置的bank数量，即一次进行能使用的最大bank数量。神经网络的权重格式也是多维数组，即number * widht * hight * channel。由于存算阵列与权重都是多维格式，一般网络较多，如果纯手动摆放整个网络的权重到存算阵列将引起很多不便，如：（1）多维数据，摆放难度大，容易出现数据覆盖问题。
[0005]（2）没有复用性，不同神经网络都需要独立处理，工作量极大。
[0006]（3）迭代困难，存放规则变化，手动变更权重存放难以为继。

技术实现思路

[0007]本专利技术的目的在于克服现有技术的...

【技术保护点】

【技术特征摘要】
1.一种针对ReRAM部署神经网络的权重分配方法，其特征在于，包括以下步骤：步骤1：读入神经网络；步骤2：读入神经网络层信息；步骤3：判断是否包括权重数据；步骤4：若是，则进行权重转换，形成3维小立方体；若否，则跳转至步骤5；步骤5：判断神经网络层是否为最后一层；步骤6：若是，则使用3d背包算法将3维小立方体存放到存算阵列转换的大立方体中；若否，则读入该神经网络层的下一层，并跳转至步骤2；步骤7：输出存放坐标。2.根据权利要求1所述的一种针对ReRAM部署神经网络的权重分配方法，其特征在于，所述步骤4中的权重转换具体为：将神经网络权重转换为存算神经网络计算引擎支持的3维小立方体。3.根据权利要求2所述的一种针对ReRAM部署神经网络的权重分配方法，其特征在于，权重转换的映射关系为：3维小立方体的rowBank表示并行放置的bank数量，即一次进行能使用的最大bank数量；一个bank由144B * 256 行组成，即一个bank的存储容量为144B * 256 = 36 KB；底面由rowBank * columns组成，表示当前的计算资源。4.根据权利要求1所述的一种针对ReRAM部署神经网络的权重分配方法，其特征在于，存算阵列转换的映射...

【专利技术属性】
技术研发人员：董光达，余少华，伍骏，熊大鹏，李涛，
申请(专利权)人：苏州亿铸智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人