为MAC阵列提供数据的方法、装置和芯片制造方法及图纸

技术编号:37985094 阅读:30 留言:0更新日期:2023-06-30 09:59
本申请提出一种为MAC阵列提供数据的方法、装置和芯片,方法包括:获取卷积窗口的尺寸;从片上存储器中获取卷积窗口本次待处理的图像特征值,以形成图像特征矩阵,对图像特征值阵列进行处理,以得到多个特征值拼接结果,并将多个特征值拼接结果保存到一个数据缓存器中,在MAC阵列在一个时钟周期所能处理的图像特征值的数据量M小于图像特征值阵列中图像特征值的总数的情况下,根据数据量M对数据缓存器中所有第二特征值拼接结果中的图像特征值进行分批处理,以得到多批图像特征值,并在多个时钟周期上将多批图像特征值发送至MAC阵列。由此,通过一个数据缓存器对图像特征数据进行存储,并对MAC阵列供数的方式,降低为MAC阵列供数时的硬件成本。阵列供数时的硬件成本。阵列供数时的硬件成本。

【技术实现步骤摘要】
为MAC阵列提供数据的方法、装置和芯片


[0001]本申请涉及计算机
,尤其涉及一种为MAC阵列提供数据的方法、装置和芯片。

技术介绍

[0002]目前,通常采用MAC(Multiply Accumulate,乘累加)阵列实现卷积运算,而卷积运算是人工智能芯片实现人工神经网络的重要逻辑运算之一。
[0003]在通过MAC阵列对对应图像进行装置的过程中,由于MAC阵列在一个时钟周期所能处理的图像特征值的数据量是有限的,相关技术中,通常采用多个数据缓存器分别对装置所需要的多个行图像特征值进行缓存,并通过多个数据缓存器为MAC阵列进行供数。然而,这种方式由于所使用的数据缓存器比较多,通过MAC阵列实现装置的成本较高。因此,如何以低成本的方式,实现为MAC阵列提供参与卷积运算的图像特征值是目前要解决的技术问题。

技术实现思路

[0004]根据本申请的第一方面,提供了一种为MAC阵列提供数据的方法,包括:获取卷积窗口的尺寸,其中,所述卷积窗口的尺寸为n
×
m
×
c,n表示所述卷积窗口的行数本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种为MAC阵列提供数据的方法,其特征在于,所述方法包括:获取卷积窗口的尺寸,其中,所述卷积窗口的尺寸为n
×
m
×
c,n表示所述卷积窗口的行数,m表示所述卷积窗口的列数,c表示所述卷积窗口的通道数,其中,n和m均为大于1的整数,c为大于或者等于1的整数;从片上存储器中获取所述卷积窗口本次待处理的n行图像特征值,以形成图像特征值阵列,其中,所述n行图像特征包括m
×
c个图像特征值,所述图像特征值阵列的行数为n,列数为m以及通道数为c;针对所述图像特征值阵列中的每一列中,针对c个通道中的每个通道,对当前列中各个行中所述通道上的图像特征值进行拼接,以得到所述当前列在所述通道上的第一特征值拼接结果,并将所述当前列在各个所述通道上的第一特征值拼接结果进行拼接,以得到所述当前列的第二特征值拼接结果;依次将所述图像特征值阵列中各个列所对应的第二特征值拼接结果保存到一个数据缓存器中;在所述MAC阵列在一个时钟周期所能处理的图像特征值的数据量M小于K的情形下,根据所述数据量M,对所述数据缓存器中所有第二特征值拼接结果中的图像特征值进行分批处理,以得到多批图像特征值,其中,每一批图像特征值中的图像特征值的数量等于M,其中,K表示所述图像特征值阵列中图像特征值的总数;按照所述多批图像特征值的存储顺序,在多个连续的时钟周期上依次将所述多批图像特征值发送至所述MAC阵列。2.如权利要求1所述的方法,其特征在于,所述方法还包括:在所述MAC阵列在一个时钟周期所能处理的图像特征值的数据量M大于或者等于K的情况下,依次从所述数据缓存器的各个第二特征值拼接结果中读取图像特征值给所述MAC阵列,直至读取的图像特征值的数量为K。3.如权利要求1所述的方法,其特征在于,所述从片上存储器中获取所述卷积窗口本次待处理的n行图像特征值,以形成图像特征值阵列,包括:通过n路读数据存储器通道RDMA从片上存储器中同时读取所述卷积窗口本次待处理的n行图像特征值,其中,每一路RDMA读取一行图像特征值;根据所述n行图像特征值,形成所述图像特征值阵列。4.如权利要求1所述的方法,其特征在于,所述按照所述多批图像特征值的存储顺序,在多个连续的时钟周期上依次将所述多批图像特征值发送至所述MAC阵列,包括:按照所述多批图像特征值的存储顺序,对所述多批图像特征值进行排序,以得到排序结果;针对所述多个连续的时钟周期中的第i个时钟周期,确定所述排序结果中位于第i位上的目标批图像特征值在所述数据缓存器中的目标起始地址,其中,i为正整数,并且小于L,其中,所述L表示所述多个连续的时钟周期的总数量;从所述目标起始地址开始从所述数据缓存器中读取出连续的M个图像特征值;将所读取出的M个图像特征值作为第i批图像特征值;将所述第i批图像特征值发送至所述MAC阵列。5.如权利要求4所述的方法,其特征在于,所述确定所述排序结果中位于第i位上的目
标批图像特征值在所述数据缓存器中的目标起始地址,包括:在所述i大于1的情形下,确定所述排序结果中位于第一位上的对应批图像特征值在所述数据缓存器中的初始起始地址;根据所述初始起始地址、所述i和所述数据量M,确定所述排序结果中位于第i位上的目标批图像特征值在所述数据缓存器中的目标起始地址。6.如权利要求4所述的方法,其特征在于,在将所述数据缓存器的深度从第一数值变为第二数值,所述数据缓存器的位宽从第三数值变为第四数值的情况下,其中,所述第一数值和所述第三数值进行相乘所得到的取值与所述第二数值和所述第四数值进行相乘所得到的取值相同,所述第四数值是所述第三数值的B倍,B为大于1的整数,所述从所述目标起始地址开始从所述数据缓存器中读取出连续的M个图像特征值,包括:从所述目标起始地址开始,从所述数据缓存器中读取出C个数据,其中,所述C是根据所述数据量M、所述第三数值和所述第四数值确定出的;从所述C个数据中,确定出M个数据,每一个所述数据所对应的位宽为所述第三数值;分别对所述M个数据中的各个数据进行B选一操作,以得到所述M个数据中各个数据对应的图像特征值。7.一种为MAC阵列提供数据的装置,其特征在于,所述装置包括:第...

【专利技术属性】
技术研发人员:胡文静梁喆马振强孙猛靳馥华
申请(专利权)人:爱芯元智半导体上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1