一种资源分配方法以及加速器组成比例

技术编号:36693604 阅读:39 留言:0更新日期:2023-02-27 20:03
本发明专利技术提供了一种资源分配方法以及加速器,该加速器含有多个忆阻器阵列,该方法包括:获取待加速的卷积神经网络的结构参数以及加速器的架构参数;基于所述结构参数和架构参数确定所述卷积神经网络模型的每个卷积层的最小需求量,所述最小需求量为在该加速器上存储对应卷积层中所有权重参数所需的最小忆阻器阵列数;根据预定的约束条件,以每个卷积层在其最小需求量的基础上的分配倍数为调整对象,确定所述卷积神经网络在该加速器上运行的总处理时延最优的资源分配策略,其中,所述最优的资源分配策略指示每个卷积层最终的分配倍数;根据每个卷积层最终的分配倍数和最小需求量,确定该卷积层分配的忆阻器阵列数量。确定该卷积层分配的忆阻器阵列数量。确定该卷积层分配的忆阻器阵列数量。

【技术实现步骤摘要】
一种资源分配方法以及加速器


[0001]本专利技术涉及存内计算领域,具体来说,涉及基于存内计算的硬件资源分配
,更具体地说,涉及一种资源分配方法以及加速器。

技术介绍

[0002]随着人工智能技术的发展,卷积神经网络已经被广泛地应用到了很多领域中,例如:图像识别、对象检测、人脸检测等。与此同时,由于卷积神经网络包含了大量的数据与计算,且多是乘法和求和运算的重复组合,现有的处理器虽然计算能力相比以前而言有很大提升,但在神经网络模型的计算过程中的并行计算效率仍稍显不足。因此,一些研究者着手研究对神经网络模型计算的硬件加速器,使得神经网络加速成为了现如今技术的热点。
[0003]其中,基于存内计算(或者称忆阻器)的卷积神经网络加速器便是当前的一种热门技术。存内计算作为一种新型的计算技术,其本身的结构有利于支持对卷积神经网络的加速需求。顾名思义,存内计算指的是存储计算一体化,它可以消除计算部件与存储器之间不必要的数据访存,从而大大减少访存带来的能量与性能损失。在存内计算领域,忆阻器是常见的存内计算器件之一,可以将数据以电阻形式进行存储。为本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于对基于忆阻器的卷积神经网络的加速器中的资源进行分配的方法,该加速器含有多个忆阻器阵列,其特征在于,包括:获取待加速的卷积神经网络的结构参数以及加速器的架构参数;基于所述结构参数和架构参数确定所述卷积神经网络模型的每个卷积层的最小需求量,所述最小需求量为在该加速器上存储对应卷积层中所有权重参数所需的最小忆阻器阵列数;根据预定的约束条件,以每个卷积层在其最小需求量的基础上的分配倍数为调整对象,确定所述卷积神经网络在该加速器上运行的总处理时延最优的资源分配策略,其中,所述最优的资源分配策略指示每个卷积层最终的分配倍数;根据每个卷积层最终的分配倍数和最小需求量,确定该卷积层分配的忆阻器阵列数量。2.根据权利要求1所述的方法,其特征在于,所述结构参数包括每个卷积层相关的以下结构信息:卷积层的输入通道数、输出通道数、输出特征图的宽和高、卷积层的核尺寸、池化层的核尺寸、卷积层的步长、池化层的步长、卷积层的填充的尺寸、池化层的填充的尺寸,其中,每个卷积层的结构信息中记录该卷积层的后一个池化层的核尺寸、池化层的步长。3.根据权利要求2所述的方法,其特征在于,所述架构参数包括忆阻器阵列的总数和每个忆阻器阵列的尺寸,该尺寸指示对应忆阻器阵列的位线数量和字线数量。4.根据权利要求3所述的方法,其特征在于,按照以下方式确定每一个卷积层的最小需求量:其中,K
c
×
K
c
表示卷积层的核尺寸,C
i
表示卷积层的输入通道数,C
o
表示卷积层的输出通道数,M表示忆阻器阵列的字线数量,N表示忆阻器阵列的位线数量。5.根据权利要求1所述的方法,其特征在于,所述方法包括:根据卷积层有没有后一个池化层以及所述池化层的核尺寸和/或池化层的步长分别计算相应的计算总处理时延。6.根据权利要求1所述的方法,其特征在于,按照以下方式确定所述卷积神经网络在该加速器上运行的总处理时延:基于忆阻器阵列的总个数和尺寸确定相应的资源分配策略;获取各卷积层在对应的资源分配策略下计算一次的周期大小和访存周期大小中最大的周期大小,并根据最大的...

【专利技术属性】
技术研发人员:李宛茜陈晓明韩银和
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1