【技术实现步骤摘要】
面向RRAM存算一体芯片的细粒度映射方法及装置
[0001]本申请涉及忆阻器存算一体
,特别涉及一种面向RRAM存算一体芯片的细粒度映射方法及装置。
技术介绍
[0002]近年来基于RRAM(Resistive Random Access Memory,阻变存储器)的存算一体芯片在神经网络加速方面存在巨大潜力,神经网络的权重可以直接被映射到基于阻变存储器的交叉阵列上进行原位计算,有效地避免冯诺依曼架构中数据搬运的开销,并且获得较高的准确率。将神经网络的权重映射到基于忆阻器的交叉阵列上前,通常需要对权重进行量化操作,并将每一层的量化好的权重部署到忆阻器阵列上。通常一个忆阻器器件可以表征一个2bit或4bit的数,以2bit忆阻器器件为例,若需要表征8bit的数,则要用4个忆阻器器件来表示。此时将一个8bit量化的卷积核映射到忆阻器阵列上时,需要4列。一层卷积若有32个卷积核,则需要至少占用32
×
4列(忆阻器阵列行数足够的情况下),神经网络部署到忆阻器阵列时,量化精度越高其最终推理的准确率越高,但同时也 ...
【技术保护点】
【技术特征摘要】
1.一种面向RRAM存算一体芯片的细粒度映射方法,其特征在于,包括以下步骤:获取待部署神经网络的网络结构和每一层卷积核参数;基于所述网络结构,利用预设的量化算法对所述待部署神经网络进行分层量化,并根据每一层量化精度和所述每一层卷积核参数,对每一层的多个卷积核进行不同精度的量化;以及将量化后的所有卷积核按照预设部署策略部署至预设的忆阻器阵列,并对部署后的所述预设的忆阻器阵列上每一列进行标记,并根据标记结果进行相加求均值操作或移位操作后得到最终忆阻器阵列,以通过所述最终忆阻器阵列进行神经网络推理。2.根据权利要求1所述的方法,其特征在于,所述基于所述网络结构,利用预设的量化算法对所述待部署神经网络进行分层量化,包括:利用所述预设的量化算法确定每一层的量化精度;根据所述每一层的量化精度对所述每一层的多个卷积核进行量化。3.根据权利要求2所述的方法,其特征在于,所述根据每一层量化精度和所述每一层卷积核参数,对每一层的多个卷积核进行不同精度的量化,包括:根据所述每一层量化精度和所述每一层卷积核参数确定每一层的每个卷积核的量化精度;基于所述每一层的每个卷积核的量化精度,逐层对所述每一层的每个卷积核的量化精度进行量化,并将每一层卷积核量化精度大于所述每一层量化精度的卷积核作为第一精度卷积核,且将所述每一层卷积核量化精度小于或等于所述每一层量化精度的卷积核作为第二精度卷积核。4.根据权利要求1所述的方法,其特征在于,所述将量化后的所有卷积核按照预设部署策略部署至预设的忆阻器阵列,包括:将所述量化后的所有卷积核按照先行再列再通道的顺序展为一列部署到所述预设的忆阻器阵列。5.根据权利要求3所述的方法,其特征在于,所述将量化后的所有卷积核按照预设部署策略部署至预设的忆阻器阵列,还包括:获取当前量化后的卷积核的量化精度,并根据所述当前量化后的卷积核的量化精度判断所述当前量化后的卷积核是否满足预设权重拆分条件;若所述当前量化后的卷积核满足所述预设权重拆分条件,则根据所述当前量化后的卷积核的量化精度和卷积核类型进行映射,其中,所述卷积核类型包括所述第一精度卷积核和所述第二精度卷积核。6.根据权利要求1所述的方法,其特征在于,在获取所述待部署神经网络的网络结构和每一层卷积核参数之前,还包括:对所述待部署神经网络进行全精度训练。7.一种面向RRAM存算一体芯片的细粒度映射装置,其特征在于,包括:获取模块,用于获取待部署神经网络的网络结构和每一层卷积核参数;量化模块,用...
【专利技术属性】
技术研发人员:张清天,李新睿,高滨,吴华强,唐建石,
申请(专利权)人:清华大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。