用于卷积计算的方法、计算设备和计算机可读存储介质技术

技术编号:27978531 阅读:25 留言:0更新日期:2021-04-06 14:13
本公开涉及一种用于卷积计算的方法、计算设备和计算机可读存储介质。该方法包括:如果确定当前周期为初始周期,从输入缓存向脉动阵列加载n*n像素的数据,脉动阵列包括第一预定数目行乘以第二预定数目列的处理单元,初始周期与初始权重相关联,n为自然数;如果确定当前周期为初始周期之后的其他周期,基于当前周期的顺序,向脉动阵列加载一列像素的数据、一行像素的数据或者一个像素的数据;以及如果确定完成当前周期所对应的数据加载,经由输出复用单元,在脉动阵列中的一组或多组n*n像素的数据中选择一组n*n像素的数据,以便提供至通用矩阵乘单元。根据本公开的实施例,能够有效降低带宽占用和功率消耗。

【技术实现步骤摘要】
用于卷积计算的方法、计算设备和计算机可读存储介质
本公开的实施例总体上涉及机器学习领域,更具体地涉及一种用于卷积计算的方法、计算设备和计算机可读存储介质。
技术介绍
机器学习中的典型运算为卷积计算,卷积计算是将卷积核中的权重和对应的输入像素块相乘再相加进而生成对应输出特征的值。块卷积需要img2col(图像到列)函数将像素块转换为矩阵,传统卷积计算的方法,例如基于img2col函数的块卷积计算,其要求每个周期加载每个权重的完整像素。例如,在原始的2x2像素的图像数据经由填充(padding)处理得到的4x4像素的图像数据上进行3x3的块卷积(9个权重,从weight0到weight8,对应于初始周期至第八周期,即cycle0至cycle8)的运算时,每个周期需要加载完整的2x2像素的数据。由于对于相邻周期,所需加载的像素数据存在相同的数据,重新加载完整的2x2像素的数据会导致浪费带宽和功率。综上,传统的卷积计算方案因每个周期需要重新加载对应于每个权重的完整像素,因此导致占用更多带宽和消耗更高的功率。专
技术实现思路
本本文档来自技高网
...

【技术保护点】
1.一种用于卷积计算的方法,包括:/n如果确定当前周期为初始周期,从输入缓存向脉动阵列加载n*n像素的数据,所述脉动阵列包括第一预定数目行乘以第二预定数目列的处理单元,所述初始周期与初始权重相关联,n为自然数;/n如果确定当前周期为初始周期之后的其他周期,基于当前周期的顺序,向脉动阵列加载一列像素的数据、一行像素的数据或者一个像素的数据;以及/n如果确定完成当前周期所对应的数据加载,经由输出复用单元,在脉动阵列中的一组或多组n*n像素的数据中选择一组n*n像素的数据,以便提供至通用矩阵乘单元。/n

【技术特征摘要】
1.一种用于卷积计算的方法,包括:
如果确定当前周期为初始周期,从输入缓存向脉动阵列加载n*n像素的数据,所述脉动阵列包括第一预定数目行乘以第二预定数目列的处理单元,所述初始周期与初始权重相关联,n为自然数;
如果确定当前周期为初始周期之后的其他周期,基于当前周期的顺序,向脉动阵列加载一列像素的数据、一行像素的数据或者一个像素的数据;以及
如果确定完成当前周期所对应的数据加载,经由输出复用单元,在脉动阵列中的一组或多组n*n像素的数据中选择一组n*n像素的数据,以便提供至通用矩阵乘单元。


2.根据权利要求1所述的方法,其中由输入缓存向脉动阵列加载n*n像素的数据包括:
经由输入复用单元,从输入缓存向脉动阵列加载n*n像素的数据,所述输入复用单元包括多个第一输入复用单元和一个第二输入复用单元。


3.根据权利要求1所述的方法,其中基于当前周期的顺序向脉动阵列加载一列像素的数据、一行像素的数据或者一个像素的数据包括:
如果确定当前周期为第一周期,向所述脉动阵列加载第n+1列像素的数据;以及
如果确定当前周期为第二周期,向所述脉动阵列加载第n+2列像素的数据。


4.根据权利要求3所述的方法,其中基于当前周期的顺序向脉动阵列加载一列像素的数据、一行像素的数据或者一个像素的数据包括:
如果确定当前周期为第三周期或者第六周期,所述脉动阵列自下而上地脉动所述处理单元的数据;以及
经由输入复用单元,从输入缓存向所述脉动阵列加载第n...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:上海壁仞智能科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1