【技术实现步骤摘要】
卷积计算加速器、卷积计算方法及卷积计算设备
本申请涉及电子电路
,特别涉及一种卷积计算加速器、卷积计算方法及卷积计算设备。
技术介绍
在数据处理领域,很多数据处理过程,比如通过卷积神经网络(ConvolutionalNeuralNetwork,CNN)进行图像处理过程,需要进行大量的卷积计算步骤。在相关技术中,计算机设备可以借助于通过硬件加速的方式来加快卷积计算的计算速度,具体比如,计算机设备可以连接专用的卷积计算加速器,该卷积计算加速器中包含有计算矩阵、控制器以及输入缓存,该计算矩阵中包含若干个计算单元,其中,每个计算单元对应的输入数据独立缓存,并在进行卷积计算时,由控制器直接控制输送至对应的计算单元,由该计算单元将该输入数据与卷积核进行卷积计算。在相关技术中,由于计算矩阵中的各个计算单元的输入数据各自独立缓存,且由控制器直接控制输送至对应的计算单元,这就需要为卷积计算加速器设计较高的缓存容量和输入带宽,影响计算矩阵的扩展性。
技术实现思路
本申请实施例提供了一种卷积计算加速器、卷积计算方法及卷积计算设备,可以解决相关技术中计算矩阵中的各个计算单元的输入数据各自独立缓存,且由控制器直接控制输送至对应的计算单元,需要为卷积计算加速器设计较高的缓存容量和输入带宽,影响计算矩阵的扩展性的问题,技术方案如下:一方面,提供了一种卷积计算加速器,所述卷积计算加速器包括:控制器、计算矩阵以及第一缓存,所述计算矩阵中包含至少一行计算单元,每行计算单元中包含至少两个计算单元,且每行计算单元中的相邻两个计算单元相连;所述控制器,用于控制将每一行计算单元的输入数据载入至所述 ...
【技术保护点】
1.一种卷积计算加速器,其特征在于,所述卷积计算加速器包括:控制器、计算矩阵以及第一缓存,所述计算矩阵中包含至少一行计算单元,每行计算单元中包含至少两个计算单元,且每行计算单元中的相邻两个计算单元相连;所述控制器,用于控制将每一行计算单元的输入数据载入至所述第一缓存;所述控制器,还用于控制将载入至所述第一缓存的输入数据输入至对应行的计算单元中,由所述对应行的计算单元将所述输入数据在所述对应行的计算单元中进行传输;所述对应行的计算单元中的每一个计算单元,用于将接收到的输入数据与预先存储的卷积核进行卷积计算。
【技术特征摘要】
1.一种卷积计算加速器,其特征在于,所述卷积计算加速器包括:控制器、计算矩阵以及第一缓存,所述计算矩阵中包含至少一行计算单元,每行计算单元中包含至少两个计算单元,且每行计算单元中的相邻两个计算单元相连;所述控制器,用于控制将每一行计算单元的输入数据载入至所述第一缓存;所述控制器,还用于控制将载入至所述第一缓存的输入数据输入至对应行的计算单元中,由所述对应行的计算单元将所述输入数据在所述对应行的计算单元中进行传输;所述对应行的计算单元中的每一个计算单元,用于将接收到的输入数据与预先存储的卷积核进行卷积计算。2.根据权利要求1所述的卷积计算加速器,其特征在于,所述控制器,用于在控制将载入至所述第一缓存的输入数据输入至对应行的计算单元中时,在一个第一时钟周期内,将所述输入数据输入至所述对应行中的第一个计算单元的寄存器中;所述对应行的计算单元中的第一计算单元,用于将接收到的所述输入数据在下一个第一时钟周期内输入至所述对应行的下一个计算单元的寄存器中,所述第一计算单元是所述对应行中除了最后一个计算单元之外的任意计算单元。3.根据权利要求2所述的卷积计算加速器,其特征在于,所述计算矩阵中的每一个计算单元,用于在一个第一时钟周期内接收输入数据,并在下一个第一时钟周期内,将接收到的输入数据与预先存储的卷积核进行卷积计算。4.根据权利要求3所述的卷积计算加速器,其特征在于,所述计算矩阵中每个计算单元中预先存储有至少两个卷积核;所述计算矩阵中的每一个计算单元,用于在一个第一时钟周期内,将接收到的输入数据与所述至少两个卷积核依次进行卷积计算。5.根据权利要求4所述的卷积计算加速器,其特征在于,所述第一时钟周期的周期长度不小于预设数量个第二时钟周期的周期长度之和,所述预设数量为计算单元内预先存储的卷积核的数量,每个卷积核对应一个第二时钟周期;所述计算矩阵中的每一个计算单元,用于在每个卷积核对应的第二时钟周期内,将接收到的输入数据与所述卷积核进行卷积计算。6.根据权利要求1至5任一所述的卷积计算加速器,其特征在于,所述卷积计算加速器还包括第二缓存,所述计算矩阵中包含至少两行计算单元,且所述至少两行计算单元组成至少两列,每一列中的相邻两个计算单元相连;所述计算矩阵中的第二计算单元,还用于将累加后的卷积计算结果存储至所述第二缓存,所述累加后的卷积计算结果是对应列中的各个计算单元的卷积计算结果的累加结果;所述第二计算单元是所述计算矩阵的最后一行中的任意计算单元。7.根据权利要求6所述的卷积计算加速器,其特征在于,所述第二计算单元,还用于在将累加后的卷积计算结果存储至所述第二缓存之前,将在上一个第一时钟周期内进行卷积计算获得的卷积计算结果,与对应列中的上一个计算单元在上一个第一时钟周期内发送的卷积计算结果进行加和计算,获得所述累加后的卷积计算结果。8.根据权利要求7所述的卷积计算加速器,其特征在于,所述计算矩阵中的第三计算单元,还用于,将在上一个第一时钟周期内进行卷积计算获得的卷积计算结果输出给对应列中的下一个计算单元;所述第三计算单元是所述计算矩阵的第一行中的任意计算单元。9.根据权利要求8所述的卷积计算加速器,其特征在于...
【专利技术属性】
技术研发人员:张博,于潇宇,王玉伟,张立鑫,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。